General Intuition的2.3B美元赌注是视频游戏可以为现实世界训练人工智能代理

当我进入General Intuition纽约办事处的研发楼层时,该公司31岁的联合创始人兼CEOPim de Witte将我的注意力引向立式办公桌上的一台显示器。似乎有人在玩《堡垒之夜》之类的游戏。那不是一个人。

“我们的代理已经连续玩了100个小时,”该公司首席产品官肯特·罗林斯 (Kent Rollins) 微笑着说道。

在我全神贯注于人工智能在游戏虚拟环境中导航的奇观之前,我听到了一个大型四足机器人接近的电子脚步声。

“为玩游戏的智能体提供动力的大脑也在为机器人提供动力,”德维特告诉我。

数据分析师乔什·杜普兰蒂斯 (Josh Duplantis) 携带一台笔记本电脑,通过机器人的单个摄像头实时传输数据,他大声解释说,机器人的默认模式是“探索”。

依靠那个摄像头和它那唯一的眼睛,这个巨大的虫子般的机器人走到我身边,围着我转了一圈,然后继续进入办公室。它偶尔会夹到椅子腿或撞到错误的垃圾桶,就像一个尚未学会自己的身体与周围世界如何联系的幼儿一样。杜普兰蒂斯表示,只用了八分钟的现实世界机器人数据就可以微调四足动物的人工智能模型。更重要的是,这些数据是在街上收集的,而不是在机器人当前自行导航的办公室内收集的。

可以从游戏玩法到模拟再到具体化的代理模型是通用直觉存在的理由。该模型确定自己在世界上的地位的能力已经获得了一些重量级人物的支持。

周四,General Intuition表示,它以23亿美元的估值筹集了3.2亿美元,证实了TechCrunch之前的报道。继去年10月推出时筹集的1.34亿美元融资后,本轮融资使General Intuition披露的融资总额达到4.54亿美元。

这家初创公司是从de Witte的另一家公司Medal中分离出来的,该公司允许游戏玩家上传和共享视频游戏剪辑。上传的数亿小时的游戏玩法提供了初始数据集,用于训练General Intuition的模型进行时空推理,或者理解如何穿越空间和时间。

但关键因素不是游戏画面;而是游戏画面。这是嵌入在这些剪辑中的动作标签:准确记录了玩家按下的按钮以及按下的时间。德维特说,大多数竞争对手都试图仅从视频中推断行为,但他认为这还不够。

“我们认为这只是未来预训练的下一阶段,”德维特说。 “我们有一个单一的模型,可以响应屏幕上的《堡垒之夜》信息并采取行动,而且还可以以法学硕士永远无法做到的方式响应现实世界的动态。”

有一次,德威特给我配备了一台运行General Intuition世界模型的笔记本电脑,这是一个逐帧生成的模拟环境,而不是由传统游戏引擎渲染的。正如我在测试世界模型时经常做的那样,我直接走进了一系列墙壁。在我尝试过的其他演示中,你控制的代理有时会直接通过,但这个却没有。从数百万小时的游戏过程中,它以某种方式了解到,墙就是墙,梯子是用来攀爬的,阴影会随着太阳的移动而拉长。

对于一般直觉来说,这个世界模型不是产品;而是产品。这是训练环境(内部称为“健身房”)。该公司最终希望出售代理模型本身,德威特认为,游戏玩法中嵌入的动作数据有助于模型从“环境”中辨别“自我”,从而使其对因果关系有更丰富的理解。

尽管General Intuition的技术在演示中令人印象深刻,但该公司并不是唯一一家试图解决这一问题的公司。此外,让这样的模型在现实世界中大规模地成立还尚未完成。大多数此类方法都需要大量的现实世界数据,这些数据的收集速度缓慢且昂贵。 General Intuition的赌注是游戏玩法是一条可扩展的捷径。

它的投资者也同意这一赌注。 General Intuition的最新一轮融资由Khosla Ventures领投,General Catalyst、Jeff Bezos、Eric Sc​​hmidt、Nico Rosberg以及Google DeepMind和MIT的研究人员参与其中。

本轮的绝大多数资金将用于扩展计算能力。 General Intuition与CoreWeave达成协议,计划重点预训练下一版本的模型。已指定一部分用于在夏末之前使其API得到更广泛的使用。

领投该轮融资的维诺德·科斯拉 (Vinod Khosla) 表示,他被德维特的愿景和该公司的专有数据地位所吸引。

“如果你看看法学硕士,当推理出现时,这是一个巨大的飞跃,”科斯拉在电话采访中告诉我。 “在世界模型中,我认为量子飞跃是人工智能中直觉的出现,这是一种类似人类直觉的能力。游戏中的人类动作数据和反应数据是直觉出现的关键部分。”

愿景是一家世代相传的公司

General Intuition并不是唯一一家注意到Medal的人类行为数据是构建动态世界模型和通用代理难题的关键部分的公司。这家初创公司的幕僚长布丽安娜·马丁 (Brianna Martin) 表示,该公司的诞生,部分原因是梅达尔拒绝了一家大型实验室的收购要约。此后也出现了其他优惠。

De Witte和他的联合创始人埃洛伊·阿隆索 (Eloi Alonso)、亚当·杰利 (Adam Jelley) 和文森特·米凯利 (Vincent Micheli) 对被收购不感兴趣,初创公司的投资者也尚未寻求退出。 General Intuition通过Medal获得的专有数据的数量和质量是科斯拉确信这家初创公司是一代人的赌注而不是并购目标的原因之一;它可以成为模拟和现实世界中广义代理和世界模型的支柱。

“在这一点上,这将是一次数据采集,这有点无趣,”科斯拉说。

该赌注的一部分还包括信任德维特的价值观。

这位企业家在人道主义领域工作了三年,其中包括在无国界医生组织工作。因此,他对如何使用General Intuition的技术划定了明确的界限:不会雇用任何特工来伤害人类。

“我们不想成为系统升级的一部分,”德维特说。 “假设我出来说,‘我们正在实行致命的自治。’你认为其他国家会发生什么?”

对军事用例的限制是在硅谷对战争变得越来越乐观之际出现的,尽管德维特表示他很高兴他的模型能够用于搜索和救援任务。

德威特是荷兰人,他的团队大部分成员都是欧洲人,这塑造了公司的形象。他说,他聘请Martin的部分原因是她决定公开退出Palantir与美国移民和海关执法局的合作。

“我不知道硅谷为什么要这么做,”他说。 “我不在是有原因的。”

德维特的道德规范不仅仅限制模型不能做的事情。作为一名十几岁时通过构建和托管私人RuneScape服务器赚了150万美元的游戏玩家,de Witte也在思考那些因人工智能模型的能力而落后的人会发生什么。

General Intuition最近推出了一个名为Nerve的平台,这是一个就业市场,可以让游戏玩家使用现有的设置赚钱。那些注册的人从数据标记开始,最终可以转向机器人远程操作和其他任务。 de Witte指出,Medal的用户群正是最容易受到人工智能驱动的流离失所影响的一代,他希望他们能够在未来的发展中受益。

De Witte希望General Intuition成为一个生态系统推动者,就像Anthropic或OpenAI一样——一个模型提供商,使其他人能够在其技术之上进行构建。如今,这家初创公司在游戏、模拟和机器人领域拥有少数客户。

“我们不会建立一家自动驾驶汽车公司,”德维特说。 “我们将使下一个人创建自动驾驶汽车公司变得容易十倍。”

该公司表示,一旦将其API交到更多客户手中,它将能够通过各种用例来测试其能力,例如在工厂车间的数字孪生中测试机器人,为游戏工作室内的类人机器人提供动力,或者派遣四足动物在危险环境中导航。

虽然四足动物是General Intuition在现实世界中尝试的第一个物理体现,​​但它也尝试过无人机和其他设备,包括在驾驶游戏中测试模型。

“它适用于任何你可以使用游戏控制器或键盘鼠标控制的东西,”德维特说。

构建数据飞轮的可能性是目标之一。

“我们将选择可以使通用基础模型作为支柱的实施例多样化的客户,”德维特说。 “因此,我们将优先选择客户,看他们是否能够提供真实世界的数据,这些数据对于推动研究来说将是有趣且有用的。如果他们拥有一支敏捷的内部团队,我们就可以成为真正的嵌入式合作伙伴并互相学习。”

科斯拉表示,General Intuition的专有数据让其走到了这一步,而其继续收集其他人没有的数据的能力将至关重要。特别是因为,尽管有令人印象深刻的演示,但模拟到现实世界的转移能否大规模进行仍然是一个悬而未决的问题,尚未有人完全回答。

更正:标题之前错误地描述了General Intuition在这一轮中筹集了多少资金。该错误已得到修复。

← 上一篇文章 Hacked Klue表示犯罪分子正在删除被盗的客户数据,但现在其他黑客正在发出威胁 下一篇文章 → Databricks的前AI主管认为他可以将AI的电费削减1,000倍

← 返回列表