Announcements
【模型上新】Claude Opus 4.8 推理模型上架
Claude Opus 4.8 推理模型于 2026 年 5 月 28 日正式上线。
Claude Opus 4.8 推理模型核心升级点
1. 编程与Agent能力全面登顶(Coding & Agent Leadership)
- SWE-Bench Pro:69.2%(较4.7+4.9%,超越GPT-5.5)
- GDPval-AA(真实Agent):1890 Elo(+137分,领先GPT-5.5 121分)
- FrontierSWE高难度工程:83%胜率,行业第一
- 完成任务步骤 -15%、输出 Token -35%,效率更高
2. 诚实度(Honesty)突破性提升(核心亮点)
- 代码缺陷漏报率降至4.7的1/4,显著减少“隐瞒问题”
- 无依据断言大幅减少,主动标记不确定性,拒绝“强行作答”
- 不对齐/欺骗行为发生率低于4.7,接近Claude Mythos Preview
3. 思考强度可调(Effort Control):速度/成本/质量自由平衡
- 网页版新增四档:Fast → High(默认)→ Extra → Max
- Fast Mode:2.5倍速、1/3成本,适合高吞吐场景
- Max Mode:复杂任务投入更多算力,输出质量最优
4. Dynamic Workflows(动态工作流):大规模Agent协同
- 支持并行调度数百个子Agent(并发上限16个,总数上限1000个)
- 适合复杂企业级工作流、大规模代码重构(如11天重写75万行)
5. 定价不变,性价比拉满
- 常规模式:$5/百万输入Token,$25/百万输出Token,与4.7同价
