安全枷锁下的最强AI：Claude Fable 5 为何连基础生物题也答不上？

Anthropic 近日正式发布了其最新一代人工智能模型Claude Fable5。作为公司目前面向大众开放的最强 AI，它在生物学、网络安全等领域的潜力备受期待。然而，这款模型在实际使用中却表现出一种“选择性失忆”:即便面对高中水平的基础生物学问题，它也往往拒绝回答，并主动将请求转接给其前代旗舰模型Claude Opus4.8。

这种现象并非源于模型能力的缺失，而是 Anthropic 出于极高安全标准所做的刻意限制。作为Mythos级模型，Claude Fable5具备极强的高阶任务处理能力，同时也伴随着显著的滥用风险。在开发与上线过程中，Anthropic 将生物学领域视为安全红线的重中之重，其防护策略甚至到了“矫枉过正”的地步。

在实际测试中，这种保守策略的副作用显而易见。无论是关于细胞线粒体功能的科普、花粉症成因的探讨，还是哮喘药物原理等无害医学常识，Claude Fable5均予以驳回。甚至连埃博拉病毒这类公共卫生相关话题，也触发了其屏蔽机制。这种“无差别拦截”导致原本具备学术价值和科普意义的交流被迫中断。

Anthropic 对此回应称，此举核心目的是为了防范恶意用户利用先进 AI 从事高风险生物研究，例如开发生物武器。公司发言人帕鲁尔・马赫什瓦里表示，为了让模型能够尽早上线，团队选择了极端保守的防护路线，并承认目前存在较多的识别误判。

对比来看，Claude Fable5在化学与网络安全领域的限制则显得更加灵活。虽然它会拒绝提供炸药制造工艺或炭疽杆菌培养方式等危险信息，但对于氯气用途、密码安全及物理学原理等中性技术问题，模型能够正常作答。只有在涉及剧毒物质等极端场景时，它才会调用上一代模型进行辅助处理。

目前，Anthropic 正致力于优化识别机制以减少误判，并计划在未来针对生物医学领域的专业用户，推出能够解锁这些限制的特定版本，旨在平衡科研效率与社会安全。这一“受限发布”模式，或许正是当前顶尖 AI 模型在追求强大性能与严苛安全之间寻找平衡的一个缩影。