Anthropic的Claude 《神鬼寓言5》是现在公众可以访问的神话版本

Anthropic首次将其最强大的人工智能模型带给公众,但它是有护栏的。
周二,这家人工智能公司推出了Claude《神鬼寓言5》,这是其Mythos模型的第一个公开版本。 Anthropic表示《神鬼寓言5》在软件工程、知识工作和视觉方面表现出色,但它具有严格的安全限制。在网络安全、生物学、化学和蒸馏等高风险领域,该模型会阻止响应并回退到Claude Opus 4.8。
Mythos于4月份作为预览版推出,由于网络安全问题,最初仅限于少数合作伙伴。上周,Anthropic扩大了对15个国家/地区数百个组织的访问范围,再次重点关注管理关键基础设施的组织。
现在,任何人都可以通过Anthropic的Claude API和基于消费的企业计划使用该技术的一个版本。订阅访问将分阶段推出:截至6月22日,《神鬼寓言5》将包含在Pro、Max、Team和基于席位的企业计划中,无需额外付费。 6月23日,Anthropic将从这些计划中删除《神鬼寓言5》,需要使用积分,并计划尽快将其恢复为标准订阅功能。
Anthropic还向已获准访问高级模型的组织部署新版本的Mythos(称为Mythos 5)。
Fable的推出正值Anthropic准备与OpenAI和埃隆·马斯克 (Elon Musk) 的SpaceX一起进入公开市场之际。此前,这家人工智能公司还呼吁全球主要人工智能实验室为前沿人工智能发展建立协调一致的刹车踏板。 Anthropic警告说,系统进步如此之快,以至于它们可能很快就会实现递归自我改进(RSI),无需人工干预即可自主改进自身。
Anthropic担心Mythos级模型落入坏人之手可能会造成什么后果,表示在发布《神鬼寓言5》之前,它已通过越狱尝试对其分类器进行了压力测试。
“在内部,我们进行了外部错误赏金,但在1,000多个小时的测试中没有产生通用越狱。然后我们与外部红队组织合作,但也未能找到通用越狱。”
也就是说,仍然有可能发生新的攻击。因此,随着《神鬼寓言5》和《神话5》的推出,Anthropic表示将要求所有流量保留30天,即使企业之前签订了零保留协议。 Anthropic表示不会将这些数据用于训练,只是为了“防御复杂和新颖的攻击,包括新的越狱”,以及“识别和减少误报”。该政策可能会开创行业先例,即访问日益强大的模型时会附带作为安全措施的强制性数据保留政策。
对于那些继续使用该模型的人来说,并不是每个问题都会得到《神鬼寓言5》的答案。 Anthropic表示《神鬼寓言》必须遵循Opus 4.8的情况很少见,早期数据显示至少95% 的《神鬼寓言》会话完全基于模型自己的响应运行。
在第三方测试中,分析公司Hex在声明中表示,Fable是第一个在复杂、长时间运行的分析任务的核心分析基准上获得90% 分数的公司。
“在最困难的问题上,它表现出了强烈的判断力和对细微差别的关注,”海克斯说。
Vibe编码平台Base44在声明中指出,Fable更擅长“一次性完整应用程序”,并且具有出色的工具调用能力。基于AI的工作空间和代理平台Genspark表示,Fable在评估中击败了所有其他模型,并且在UI设计和游戏编码等任务上表现明显更好。
Fable 5和Mythos 5的定价均为每百万输入代币10美元,每百万输出代币50美元,是Opus 4.8价格的两倍。仅这个价格就可能成为广泛使用的阻碍。
许多企业在看到账单到来或提前耗尽年度人工智能预算后,对人工智能成本越来越不满。 Opus 4.8等高级模型可能会加剧这些问题,因为其高级推理技能可以将单个请求拆分为多个任务。
Anthropic表示预计《神鬼寓言5》的需求将非常高且难以预测。事实上,有些人,比如购物奖励平台乐天,可能会认为其优势是值得的。
乐天在声明中表示:“《神鬼寓言》尽最大努力反思并验证自己的工作。” “对我们来说,这就是使高度自主操作成为可能的原因——额外的思考是值得的。”