Claude Opus 4.8 上线：更诚实、不偷懒，还有动态工作流

距离 Opus 4.7 发布仅 43 天，Anthropic 就推出了 Claude Opus 4.8。这不是一次简单的跑分升级，而是针对开发者最痛的两个问题做了定向优化：AI 偷懒 和 过度自信。同时上线的动态工作流功能，让 Claude Code 能一次性拉起数百个子智能体并行完成任务。

Opus 4.8 的三个关键改进

1. 更诚实，不偷懒

过去用 Claude 写代码，经常遇到这种情况：它噼里啪啦写了一大段，特别自信地说搞定了没问题。你一跑，另一个地方崩了。你回去问它，它又说找到了绝对没问题了。你再跑，又报错。

Opus 4.8 针对这个问题做了重点优化。官方数据显示：

代码缺陷漏报率降至 Opus 4.7 的 1/4
"硬编答案"等过度自信行为概率降至 Opus 4.7 的 1/10
在偷懒检测指标上，Opus 4.8 是唯一能做到 0% 不良率 的模型

代码缺陷漏报率对比

实测中，Opus 4.8 会非常详细地全面审查代码，找尽可能需要优化的地方，而不是像前代那样草草了事。

2. 更精确，但也更"听话"

Opus 4.8 变得更精确了，指哪打哪，更加遵循指令。对于专业开发者来说，这是好事 -- 错误率和幻觉率都在降低。

但这也带来一个变化：它的主动性变弱了。你让它干 A，它现在就只干 A，不会自作主张顺便把 B 也办了。如果你的使用习惯依赖 AI 的"猜你想要"能力，需要调整一下交互方式，把需求说得更明确。

3. 思考强度对所有用户开放

所有套餐（包括免费用户）都可以在 Chat 模式下调整模型的 effort（努力程度），从 Low 到 Max 四个档位。配合自适应思考功能，你可以根据任务复杂度灵活选择。

思考强度控制

动态工作流：数百子智能体并行

与 Opus 4.8 同日上线的 动态工作流（Dynamic Workflows） 是 Claude Code 的重大功能升级，目前在 CLI、桌面版和 VS Code 扩展中以研究预览形式提供。

工作原理

Claude 根据提示词动态生成一个 JavaScript 编排脚本
将任务拆解成子任务，分发给数十甚至数百个并行运行的子智能体
一批子智能体从不同角度处理问题，另一批负责反驳前者的发现
整个流程反复迭代直到结果收敛
最终合并为统一输出交给用户

与此前 Claude Code 的子智能体机制有本质区别：之前的中间结果要回到对话上下文中占用 Token，动态工作流将编排逻辑移入代码脚本，Claude 的上下文中只保留最终结果。

动态工作流运作机制

标杆案例：Bun 从 Zig 到 Rust 的移植

Bun 创始人 Jarred Sumner 使用动态工作流完成了 JavaScript 运行时 Bun 从 Zig 到 Rust 的移植：

一个工作流为每个 struct 字段映射正确的 Rust lifetime
下一个工作流为每个 .zig 文件编写行为一致的 .rs 版本
数百个智能体并行工作
从首次 commit 到 merge 耗时 11 天，产出约 75 万行 Rust 代码
99.8% 的现有测试套件通过

如何触发

有两种方式：

方式一：在 Claude Code 中直接说"创建一个动态工作流..."（prompt 中包含 workflow 关键词）
方式二：开启 Ultracode 设置，Claude 会自动判断何时使用工作流

注意： 动态工作流的 Token 消耗会明显高于普通 Claude Code 会话。首次触发时，Claude Code 会展示即将运行的内容并要求你确认。

价格与模型信息

项目	详情
标准版价格	输入 $5/M Token，输出 $25/M Token
Fast 模式	2.5 倍速度，输入 $10/M，输出 $50/M（比前代 Fast 便宜三分之二）
上下文长度	与 Opus 4.7 一致
最大上下文	与 Opus 4.7 一致

适合谁用

专业开发者：Opus 4.8 的精确性和诚实性大幅提升，配合动态工作流处理大型代码迁移
团队协作：动态工作流适合跨数百个文件的批量修改和缺陷排查
长时任务：Opus 4.8 可以长时间执行任务，人类不用频繁回来检查工作

需要注意的

动态工作流目前是研究预览，功能还在迭代
如果你习惯依赖 AI 的主动性（"猜你想要"），需要调整交互方式，把需求说得更明确
创作能力比 Opus 4.7 有进步，但与 Opus 4.6 相比仍有差距

Opus 4.8 的三个关键改进

1. 更诚实，不偷懒

Opus 4.8 针对这个问题做了重点优化。官方数据显示：

代码缺陷漏报率降至 Opus 4.7 的 1/4
"硬编答案"等过度自信行为概率降至 Opus 4.7 的 1/10
在偷懒检测指标上，Opus 4.8 是唯一能做到 0% 不良率 的模型

代码缺陷漏报率对比

实测中，Opus 4.8 会非常详细地全面审查代码，找尽可能需要优化的地方，而不是像前代那样草草了事。

Claude 根据提示词动态生成一个 JavaScript 编排脚本
将任务拆解成子任务，分发给数十甚至数百个并行运行的子智能体
一批子智能体从不同角度处理问题，另一批负责反驳前者的发现
整个流程反复迭代直到结果收敛
最终合并为统一输出交给用户

动态工作流运作机制

标杆案例：Bun 从 Zig 到 Rust 的移植

Bun 创始人 Jarred Sumner 使用动态工作流完成了 JavaScript 运行时 Bun 从 Zig 到 Rust 的移植：

一个工作流为每个 struct 字段映射正确的 Rust lifetime
下一个工作流为每个 .zig 文件编写行为一致的 .rs 版本
数百个智能体并行工作
从首次 commit 到 merge 耗时 11 天，产出约 75 万行 Rust 代码
99.8% 的现有测试套件通过

如何触发

有两种方式：

方式一：在 Claude Code 中直接说"创建一个动态工作流..."（prompt 中包含 workflow 关键词）
方式二：开启 Ultracode 设置，Claude 会自动判断何时使用工作流

注意： 动态工作流的 Token 消耗会明显高于普通 Claude Code 会话。首次触发时，Claude Code 会展示即将运行的内容并要求你确认。

价格与模型信息

项目	详情
标准版价格	输入 $5/M Token，输出 $25/M Token
Fast 模式	2.5 倍速度，输入 $10/M，输出 $50/M（比前代 Fast 便宜三分之二）
上下文长度	与 Opus 4.7 一致
最大上下文	与 Opus 4.7 一致

适合谁用

专业开发者：Opus 4.8 的精确性和诚实性大幅提升，配合动态工作流处理大型代码迁移
团队协作：动态工作流适合跨数百个文件的批量修改和缺陷排查
长时任务：Opus 4.8 可以长时间执行任务，人类不用频繁回来检查工作

需要注意的

动态工作流目前是研究预览，功能还在迭代
如果你习惯依赖 AI 的主动性（"猜你想要"），需要调整交互方式，把需求说得更明确
创作能力比 Opus 4.7 有进步，但与 Opus 4.6 相比仍有差距

全部

AI教程

AI产品

AI资源

Claude Opus 4.8 上线：更诚实、不偷懒，还有动态工作流

Claude Opus 4.8 上线：更诚实、不偷懒，还有动态工作流

作者

分类

相关文章

BARKOD：把丑了 70 年的条形码变成艺术品

AI Desk Card：一块墨水屏，让 AI 接管你屏幕边的便签纸

Cohere Command A+ 开源：2180 亿参数，Apache 2.0 协议

Claude Opus 4.8 上线：更诚实、不偷懒，还有动态工作流

Claude Opus 4.8 上线：更诚实、不偷懒，还有动态工作流

作者

分类

相关文章

BARKOD：把丑了 70 年的条形码变成艺术品

AI Desk Card：一块墨水屏，让 AI 接管你屏幕边的便签纸

Cohere Command A+ 开源：2180 亿参数，Apache 2.0 协议