Anthropic手Claude编码更多控制,但保持控制

对于使用人工智能的开发人员来说,“氛围编码”现在归结为照顾每一个动作,或者冒着让模型不受控制地运行的风险。 Anthropic表示,其对Claude的最新更新旨在通过让人工智能自行决定哪些操作是安全的(但有一定限制)来消除这种选择。

此举反映出整个行业正在发生更广泛的转变,因为人工智能工具越来越多地被设计为无需等待人类批准即可采取行动。挑战在于平衡速度与控制:过多的护栏会减慢速度,而太少则会使系统充满风险且不可预测。 Anthropic的新“自动模式”现已处于研究预览阶段——这意味着它可用于测试,但尚未成为成品——这是其最新的尝试。

自动模式使用AI防护措施在运行之前检查每个操作,检查用户未请求的危险行为以及提示注入的迹象 - 一种攻击类型,其中恶意指令隐藏在AI正在处理的内容中,导致其采取意外操作。任何安全的操作都会自动进行,而有风险的操作会被阻止。

它本质上是Claude Code现有的“危险跳过权限”命令的扩展,该命令将所有决策权交给人工智能,但在顶部添加了安全层。

该功能建立在GitHub和OpenAI等公司的一系列自主编码工具的基础上,这些工具可以代表开发人员执行任务。但它更进一步,将何时请求用户许可的决定权转移给了人工智能本身。

Anthropic尚未详细说明其安全层用于区分安全操作和危险操作的具体标准——开发人员在广泛采用该功能之前可能希望更好地了解这一点。 (TechCrunch已联系该公司以获取有关这方面的更多信息。)

自动模式是在Anthropic推出Claude Code Review和Dispatch for Cowork后推出的,Claude Code Review是其自动代码审查器,旨在在bug进入代码库之前捕获它们;Dispatch for Cowork允许用户将任务发送给AI代理以代表他们处理工作。

← 上一篇文章 千问打车新玩法:各地文旅“整活儿”推荐,网友一试居然真能到 下一篇文章 → 肯塔基州妇女拒绝2600万美元将她的农场改造成数据中心的提议

← 返回列表