toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,182个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

Claude Opus 4.8 上线:更诚实、不偷懒,还有动态工作流

2026/05/30
·toolin小编

Anthropic 发布 Claude Opus 4.8,代码缺陷漏报率降至前代四分之一,同步上线动态工作流支持数百子智能体并行,思考强度对所有用户开放。

Claude Opus 4.8 上线:更诚实、不偷懒,还有动态工作流
Claude Opus 4.8 上线:更诚实、不偷懒,还有动态工作流
2026/05/30

Claude Opus 4.8 上线:更诚实、不偷懒,还有动态工作流

Anthropic 发布 Claude Opus 4.8,代码缺陷漏报率降至前代四分之一,同步上线动态工作流支持数百子智能体并行,思考强度对所有用户开放。

Opus 4.8 的三个关键改进1. 更诚实,不偷懒2. 更精确,但也更"听话"3. 思考强度对所有用户开放动态工作流:数百子智能体并行工作原理标杆案例:Bun 从 Zig 到 Rust 的移植如何触发价格与模型信息适合谁用需要注意的
AI产品

距离 Opus 4.7 发布仅 43 天,Anthropic 就推出了 Claude Opus 4.8。这不是一次简单的跑分升级,而是针对开发者最痛的两个问题做了定向优化:AI 偷懒 和 过度自信。同时上线的动态工作流功能,让 Claude Code 能一次性拉起数百个子智能体并行完成任务。

Opus 4.8 的三个关键改进

1. 更诚实,不偷懒

过去用 Claude 写代码,经常遇到这种情况:它噼里啪啦写了一大段,特别自信地说搞定了没问题。你一跑,另一个地方崩了。你回去问它,它又说找到了绝对没问题了。你再跑,又报错。

Opus 4.8 针对这个问题做了重点优化。官方数据显示:

  • 代码缺陷漏报率降至 Opus 4.7 的 1/4
  • "硬编答案"等过度自信行为概率降至 Opus 4.7 的 1/10
  • 在偷懒检测指标上,Opus 4.8 是唯一能做到 0% 不良率 的模型

代码缺陷漏报率对比

实测中,Opus 4.8 会非常详细地全面审查代码,找尽可能需要优化的地方,而不是像前代那样草草了事。

2. 更精确,但也更"听话"

Opus 4.8 变得更精确了,指哪打哪,更加遵循指令。对于专业开发者来说,这是好事 -- 错误率和幻觉率都在降低。

但这也带来一个变化:它的主动性变弱了。你让它干 A,它现在就只干 A,不会自作主张顺便把 B 也办了。如果你的使用习惯依赖 AI 的"猜你想要"能力,需要调整一下交互方式,把需求说得更明确。

3. 思考强度对所有用户开放

所有套餐(包括免费用户)都可以在 Chat 模式下调整模型的 effort(努力程度),从 Low 到 Max 四个档位。配合自适应思考功能,你可以根据任务复杂度灵活选择。

思考强度控制

动态工作流:数百子智能体并行

与 Opus 4.8 同日上线的 动态工作流(Dynamic Workflows) 是 Claude Code 的重大功能升级,目前在 CLI、桌面版和 VS Code 扩展中以研究预览形式提供。

工作原理

  1. Claude 根据提示词动态生成一个 JavaScript 编排脚本
  2. 将任务拆解成子任务,分发给数十甚至数百个并行运行的子智能体
  3. 一批子智能体从不同角度处理问题,另一批负责反驳前者的发现
  4. 整个流程反复迭代直到结果收敛
  5. 最终合并为统一输出交给用户

与此前 Claude Code 的子智能体机制有本质区别:之前的中间结果要回到对话上下文中占用 Token,动态工作流将编排逻辑移入代码脚本,Claude 的上下文中只保留最终结果。

动态工作流运作机制

标杆案例:Bun 从 Zig 到 Rust 的移植

Bun 创始人 Jarred Sumner 使用动态工作流完成了 JavaScript 运行时 Bun 从 Zig 到 Rust 的移植:

  • 一个工作流为每个 struct 字段映射正确的 Rust lifetime
  • 下一个工作流为每个 .zig 文件编写行为一致的 .rs 版本
  • 数百个智能体并行工作
  • 从首次 commit 到 merge 耗时 11 天,产出约 75 万行 Rust 代码
  • 99.8% 的现有测试套件通过

如何触发

有两种方式:

  • 方式一:在 Claude Code 中直接说"创建一个动态工作流..."(prompt 中包含 workflow 关键词)
  • 方式二:开启 Ultracode 设置,Claude 会自动判断何时使用工作流

注意: 动态工作流的 Token 消耗会明显高于普通 Claude Code 会话。首次触发时,Claude Code 会展示即将运行的内容并要求你确认。

价格与模型信息

项目详情
标准版价格输入 $5/M Token,输出 $25/M Token
Fast 模式2.5 倍速度,输入 $10/M,输出 $50/M(比前代 Fast 便宜三分之二)
上下文长度与 Opus 4.7 一致
最大上下文与 Opus 4.7 一致

适合谁用

  • 专业开发者:Opus 4.8 的精确性和诚实性大幅提升,配合动态工作流处理大型代码迁移
  • 团队协作:动态工作流适合跨数百个文件的批量修改和缺陷排查
  • 长时任务:Opus 4.8 可以长时间执行任务,人类不用频繁回来检查工作

需要注意的

  • 动态工作流目前是研究预览,功能还在迭代
  • 如果你习惯依赖 AI 的主动性("猜你想要"),需要调整交互方式,把需求说得更明确
  • 创作能力比 Opus 4.7 有进步,但与 Opus 4.6 相比仍有差距
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
Opus 4.8 的三个关键改进1. 更诚实,不偷懒2. 更精确,但也更"听话"3. 思考强度对所有用户开放动态工作流:数百子智能体并行工作原理标杆案例:Bun 从 Zig 到 Rust 的移植如何触发价格与模型信息适合谁用需要注意的

相关文章

Step 3.7 Flash接入Claude Code实测指南
AI教程

Step 3.7 Flash接入Claude Code实测指南

阶跃开源Flash模型实测接入Claude Code,用复杂Agent工作流验证国产模型能否顶上闭源基座

avatar for toolin小编
toolin小编
16小时前
用 Image2 + Seedance 2.0 制作 AI 长视频:品牌广告实操
AI教程

用 Image2 + Seedance 2.0 制作 AI 长视频:品牌广告实操

从资产准备到剪辑拼接的完整流程,教你用 AI 工具链制作 115 秒品牌广告长视频,解决人脸漂移、场景不统一等核心痛点。

avatar for toolin小编
toolin小编
1天前
Codex 全攻略:从入门到国内可用的三种方案
AI教程

Codex 全攻略:从入门到国内可用的三种方案

开源免费的 Codex 实战指南发布,涵盖桌面端安装、手机端远程操控、国内三种接入方案,帮你从零跑通 OpenAI Codex。

avatar for toolin小编
toolin小编
1天前