Anthropic 近日正式发布了其最新一代人工智能模型
这种现象并非源于模型能力的缺失,而是 Anthropic 出于极高安全标准所做的刻意限制。作为

在实际测试中,这种保守策略的副作用显而易见。无论是关于细胞线粒体功能的科普、花粉症成因的探讨,还是哮喘药物原理等无害医学常识,Claude Fable5均予以驳回。甚至连埃博拉病毒这类公共卫生相关话题,也触发了其屏蔽机制。这种“无差别拦截”导致原本具备学术价值和科普意义的交流被迫中断。
Anthropic 对此回应称,此举核心目的是为了防范恶意用户利用先进 AI 从事高风险生物研究,例如开发生物武器。公司发言人帕鲁尔・马赫什瓦里表示,为了让模型能够尽早上线,团队选择了极端保守的防护路线,并承认目前存在较多的识别误判。
对比来看,Claude Fable5在化学与网络安全领域的限制则显得更加灵活。虽然它会拒绝提供炸药制造工艺或炭疽杆菌培养方式等危险信息,但对于氯气用途、密码安全及物理学原理等中性技术问题,模型能够正常作答。只有在涉及剧毒物质等极端场景时,它才会调用上一代模型进行辅助处理。
目前,Anthropic 正致力于优化识别机制以减少误判,并计划在未来针对生物医学领域的专业用户,推出能够解锁这些限制的特定版本,旨在平衡科研效率与社会安全。这一“受限发布”模式,或许正是当前顶尖 AI 模型在追求强大性能与严苛安全之间寻找平衡的一个缩影。