Back to announcements
Announcements

【模型上新】Claude Opus 4.8 推理模型上架

Claude Opus 4.8 推理模型于 2026 年 5 月 28 日正式上线。

Claude Opus 4.8 推理模型核心升级点

1. 编程与Agent能力全面登顶(Coding & Agent Leadership)

  • SWE-Bench Pro:69.2%(较4.7+4.9%,超越GPT-5.5
  • GDPval-AA(真实Agent):1890 Elo(+137分,领先GPT-5.5 121分
  • FrontierSWE高难度工程:83%胜率,行业第一
  • 完成任务步骤 -15%、输出 Token -35%,效率更高

2. 诚实度(Honesty)突破性提升(核心亮点)

  • 代码缺陷漏报率降至4.7的1/4,显著减少“隐瞒问题”
  • 无依据断言大幅减少,主动标记不确定性,拒绝“强行作答”
  • 不对齐/欺骗行为发生率低于4.7,接近Claude Mythos Preview

3. 思考强度可调(Effort Control):速度/成本/质量自由平衡

  • 网页版新增四档:Fast → High(默认)→ Extra → Max
  • Fast Mode:2.5倍速、1/3成本,适合高吞吐场景
  • Max Mode:复杂任务投入更多算力,输出质量最优

4. Dynamic Workflows(动态工作流):大规模Agent协同

  • 支持并行调度数百个子Agent(并发上限16个,总数上限1000个)
  • 适合复杂企业级工作流、大规模代码重构(如11天重写75万行)

5. 定价不变,性价比拉满

  • 常规模式:$5/百万输入Token,$25/百万输出Token,与4.7同价