Anthropic发布带有新“动态工作流程”工具的Opus 4.8

周四,Anthropic发布了Opus 4.8,这是其最先进的公开模型的最新版本。该型号随处可见,标准定价与之前的Opus版本相同。
新型号在Opus 4.7发布后仅41天就推出了,这比Anthropic的正常升级周期要快得多。 (最新的Sonnet和Haiku模型分别推出了三个月和七个月。)快速的周转可能与Opus 4.7的冷淡反应有关,一些用户对此感到失望。
在此期间,OpenAI的Codex和Google的Gemini Flash模型也发布了重要的新版本,增加了Anthropic跟上步伐的压力。
Opus 4.8具有预期的同类最佳基准测试结果,但也特别关注模型如何管理不良或不确定的数据。在发布帖子中,Anthropic的早期测试人员发现,新模型“更有可能标记其工作的不确定性,并且不太可能提出不受支持的主张。”
Bridgewater同事的一份证言呼应了这一点,称升级中最大的区别是“Opus 4.8倾向于主动标记分析输入和输出的问题,而其他模型通常会忽略这些问题,并让用户自己发现。”
与新模型一起,Anthropic推出了一项名为“动态工作流程”的功能,该功能将在研究预览中提供。该系统旨在帮助Opus等大型模型管理数百个并行子代理的复杂任务。
“Claude与Opus 4.8一起的代码现在可以在从初创公司到合并的数十万行代码中执行代码库规模的迁移,以现有的测试套件为标准,”该帖子解释道。
在上个月的试探性预览引发网络安全担忧后,Anthropic仍保留其最先进的Mythos模型。然而,该公司在今天的Opus版本中暗示,一旦必要的保障措施完成,Mythos预览期可能很快就会结束。
该公司写道:“我们在开发这些保障措施方面正在迅速取得进展,并期望能够在未来几周内为我们的所有客户带来Mythos级模型。”