借助Gemini 3.5 Flash,Google将下一波AI浪潮押注于代理,而不是聊天机器人

Google于周二推出Gemini 3.5 Flash,这是一种新的AI模型,该公司称其是迄今为止最强大的编码和自主AI代理。该模型是在公司年度I/O开发者大会上推出的,可以独立执行编码管道、管理研究项目,并在内部测试中完全从头开始构建操作系统。

此次发布标志着Google从将人工智能作为对话工具转变为人工智能作为代理工具。它不仅仅是回答问题,而是以最少的人力投入来规划、构建和迭代实际工作。

DeepMind首席技术专家Koray Kavukcuoglu在周一公开发布前对记者表示:“3.5 Flash提供了令人难以置信的质量和低延迟组合。” “它在几乎所有基准测试上都优于我们最新的前沿模型3.1 Pro”,包括编码、代理任务和多模态推理。

他补充说,它比其他前沿模型快四倍,这种速度非常适合编码和代理任务,但Google通过开发Flash的优化版本,在相同质量下速度提高了12倍,“将其提升到了另一个水平”。

Kavukcuoglu表示,这种速度是Flash代理工作设计的核心,多个AI代理同时运行在长时间运行的任务上。在I/O的舞台上,Google工程师Varun Mohan演示了代理在单独的组件上工作,然后聚集在一起在Antigravity(该公司的代理开发平台和IDE)内构建完整的操作系统。

Kavukcuoglu表示,Flash 3.5是与Antigravity共同开发的,以便代理可以拥有“他们可以生活、工作和执行的原生环境”。

在I/O上,Google发布了Antigravity 2.0,这是一个围绕代理优先开发设计的独立桌面应用程序。

收益不仅仅体现在演示上。 Google表示3.5 Flash的代理功能已经在合作伙伴之间产生了影响,例如银行和金融科技公司自动化了数周的工作流程,或者数据科学团队在复杂的数据环境中寻找见解。

该模型可以自主运行多个小时,但Google的高级总监兼产品主管Tulsee Doshi表示,当遇到需要人类判断的决策点或权限问题时,它有时会暂停并请求用户输入。

当Google发布即将推出的3.5 Pro型号时,两者被设计为协同工作。

“3.5 Pro成为你的协调者、规划者,然后它实际上可以利用Flash成为各种子代理,”Doshi告诉TechCrunch。 “我认为这实际上取决于你真正需要推理能力的地方,你真正想要能够真正推动推理的更大模型的地方,以及你真正需要良好的强力工具使用能力的任务的地方?”

3.5 Flash现在是Gemini应用程序和全局搜索中AI模式的默认模型。在I/O大会上,Google还宣布了Search的代理功能,让用户可以直接在平台上创建、自定义和管理AI代理。新模型还将为Google的新型个人人工智能代理Gemini Spark提供支持,该代理旨在24/7运行,以帮助消费者管理他们的数字生活。

为普通消费者提供这种水平的人工智能能力需要经过严格审查。 Google目前正面临诉讼,原因是一名男子去年与Gemini交谈数周后差点造成大规模伤亡事件并自杀身亡。

当更广泛地提供强大的自主代理时,危害的影响只会增加。 Google表示Gemini 3.5加强了网络和CBRN(化学、生物、放射性和核)保障措施,并且更好地应对敏感问题,而不是直接拒绝。

Gemini 3.5 Flash目前可通过Antigravity、Gemini API和Gemini Enterprise,以及通过Gemini应用程序和搜索中的AI模式获得。

← 上一篇文章 如何使用Google的新信息代理 下一篇文章 → Google的Genie世界模型现在可以通过街景模拟真实街道

← 返回列表