一颗卫星刚刚学会了自己寻找东西——这意味着什么

地球观测卫星首次在没有地面人类分析人员的情况下自行找到了它想要的东西。这一里程碑事件发生在四月,标志着视觉语言模型在轨道上的首次使用,并让人们了解人工智能如何从根本上改变天基传感器的能力以及它们的价值。
通常,卫星会将大量数据下载给地面上的分析师,他们使用机器学习算法或自己的眼睛来弄清楚发生了什么。但在由太空基础设施公司Loft Orbital建造的Yam-9号航天器上,NASA喷气推进实验室构建的软件包确定了响应自然语言查询的感兴趣领域。
Google DeepMind的Gemma 3——为演示提供支持的视觉语言模型(VLM)——是专门为边缘应用程序构建的,这意味着它被设计为在远离数据中心的有限硬件上运行。 VLM将大型语言模型的上下文理解与图像分析能力结合起来:例如,研究人员要求模型在自然环境满足人类发展的情况下对传感器数据进行分类,或者识别铁路枢纽周围的基础设施——它确实做到了。
这次演示之所以意义重大,有两个原因。在短期内,它可以通过在轨道上进行初始数据分类来使空间传感器变得更加有用,从而减少分析师目前必须费力处理的大量原始数据。从长远来看,这是在太空运行更大规模人工智能基础设施的证据。
“它为太空中始终在线的巡逻层打开了大门,”Loft的人工智能主管Paul Lasserre告诉TechCrunch。 “如果你有一个VLM,你就可以有逻辑——比如‘为我监控这个边界,当有可疑情况时让我知道’,并与卫星来回交互。”
Loft的航天器被设计为第三方客户的平台。与传统的卫星制造相比,这种商业模式更接近于基础设施即服务。最近的一项交易是它为《地球日报》建造、发射和运营六颗新卫星,该卫星将分析和销售在航天器上收集的数据。 Yam-9于2025年秋季推出,作为该公司轨道人工智能项目的探路者,其中包括Nvidia Jetson Orrin AGX GPU,这是太空计算中使用的领先芯片之一。
Juan Delfa Victoria是NASA JPL人工智能小组的技术负责人,领导了NAVI-Orbital的开发,该软件包实际上是Gemma 3 VLM的工具。虽然Gemma 3已下架,但软件工程师必须简化软件包以减少所需的库和内存量。
虽然这是首次报道在轨道上使用VLM,但我们预计其他公司也会效仿。 Planet Labs使用Jetson Orin处理器发射卫星;目前,它正在将它们用于更简单的物体检测任务,但一位发言人表示,其他人工智能应用程序(包括VLM)的研究正在进行中。
开普勒通信公司(Kepler Communications)运营着太空中最大的GPU群,由于与合作伙伴签订了NDA协议,该公司拒绝透露是否在太空中部署了VLM,但指出自1月份这些航天器发射以来,“我们的计算环境存在一些未公开的用例”。
“现在我们已经证明了这个概念,这确实是前进的方向,”拉塞尔说。目标是建立一个星座,以确保实时覆盖地球上的任何地方,他说这将需要50到100颗像Yam-9这样的卫星。 (Loft目前在轨运行着12艘航天器。)
在轨道上部署这些较小模型的经验教训将告诉公司如何尝试在太空中部署更大规模的计算基础设施,特别是在电源和内存管理等平淡但重要的领域。
它们还可以为新的科学工具铺平道路。 NAVI-Space的想法源自喷气推进实验室研究员塔兰·西里亚克·约翰 (Taran Cyriac John),他正在考虑为探索月球或火星的宇航员提供数字助理。
“我们在想,好吧,宇航员穿着加压服,你知道他们不能敲击键盘,他们想做的事情都很复杂。”德尔法·维多利亚说道。 “那么,我们提供一个助手怎么样,就像在视频游戏和电影中一样,你可以在其中看到交互式人工智能?”
只是不要将其称为HAL 9000。