我们尝试了Google的AI眼镜,它们就快到了

在本周的Google的I/O开发者大会上,我们有机会简短地体验了其即将推出的人工智能眼镜——不是Google所说的将于今年秋天开始发货的纯音频眼镜,而是提供综合音频和视觉体验的眼镜。
这些Android XR眼镜在去年的活动中首次发布,配备镜头内显示屏,可将有用的信息呈现在您面前,覆盖在现实世界之上。其中包括可以显示天气、步行路线、Uber接送详细信息、实时翻译等内容的小部件,甚至是您使用人工智能自行设计的小部件。

该公司指出,这款眼镜还将与iOS和Android手机配对,无论是纯音频格式还是未来的显示版本。
带显示屏的眼镜是继今年晚些时候推出的第一代音频眼镜之后的下一步。这些眼镜本身是与Warby Parker、Gentle Monster和三星合作开发的,将Google的技术与其品牌的设计美学融为一体。
与此同时,我们测试的眼镜在很大程度上仍然是一个原型,尽管它已经足够抛光,现在可以进行外部测试。演示XR眼镜的代表解释说,原型让Google不必担心与不同款式和形状相关的一些外观细节,因此它可以专注于更自由地试验显示技术及其对电池寿命的影响。这意味着这些眼镜在贴合度、形状、尺寸和对细节的关注方面与任何未来运输版本的眼镜都非常不同。相反,它更像是能够在仍然使用基本、舒适的镜框的情况下试验眼镜的“内部”。
出厂版本的眼镜将能够检测眼镜何时戴在头上以及何时摘下,但我们尝试过的眼镜没有此功能。

要激活Gemini,您需要按下眼镜框的右侧两秒钟。初创公司铃声会响起,让您知道Gemini已打开并正在监听。在演示版本中,初创公司Gemini也会同时初创公司相机,但正式版本将允许用户配置是否要在Gemini初创公司时打开相机。
在最初的测试中,我们通过要求Gemini播放最喜欢的艺术家的方式通过眼镜播放音乐。不幸的是,场地太吵了,无法评估音质,因为音乐被调到最大音量,但仍然相对难以听清清晰和细节。但从这次有限的体验中得到的初步印象是,这款眼镜并不能很好地替代高质量的耳塞,尽管如果你只是想在户外、散步、远足或做家务时听点音乐,那么它们就可以了。与Apple的AirPods等设备上的透明模式体验相比,不戴耳塞的优点是您可以更轻松地听到别人说话。
要关闭音乐,您只需轻按一下框架侧面的中间位置,就像轻按太阳穴一样。

在第二个测试中,我们用手指按下拍照按钮来拍摄一个人的照片。显示屏关闭,因此图片被传输到我们的手机和手表上。 (稍后您将能够通过长按来捕获视频,但此选项无法用于原型测试。对于视频,您将看到视频缩略图预览而不是照片。)
您还可以简单地要求Gemini拍照,而无需按照片按钮,并对结果进行某种人工智能处理。例如,您可以说“拍一张照片并将其变成动漫人物”。照片被发送到手机,然后发送到Gemini和Nano Banana服务器,然后以编辑后的版本返回。
在Google I/O会场,Wi-Fi负载较重,往返时间约为45秒。

启用显示后,您将看到一个简单的主屏幕出现在您的视野中。演示版预装了一些小部件,显示天气和Google I/O活动倒计时。您还可以在特定应用程序中构建快速初创公司器,例如Google地图或翻译(如果这些是您眼镜的主要用例)。
该原型机的右眼上只有一个显示器,但该平台可以支持单显示器和双显示器,以及纯音频眼镜。图像本身有点模糊,但我们将此归因于我们的处方隐形眼镜,其中包括在一侧佩戴一个针对距离进行优化的镜片,在另一侧佩戴针对近视力进行优化的镜片。当我们闭上一只眼睛时,图像变得更清晰,但这种体验几乎立即让我们右眼上方出现一些眼睛疲劳,目前还不清楚处方是否完全是罪魁祸首。

最好的演示之一是眼镜上的语言翻译体验,它由手机上的Google翻译应用程序提供支持。其中一名示威者说着快速的西班牙语,眼镜自动检测到该语言并在显示屏上显示英语文本,而Gemini在我们耳边说着英语。我们可以看到世界各地的旅行者仅仅为了这种体验而购买眼镜。
我们应该注意到,翻译也适用于纯音频眼镜,只是眼镜本身不会显示文本。相反,如果需要,除了实时音频反馈之外,您还可以在手机上看到转录。
另一个演示涉及使用眼镜进行导航。虽然显然我们无法出去散步并离开场地来测试其准确性,但我们可以了解它是如何工作的。您可以通过要求Gemini导航到目的地来开始Google地图体验 - 该目的地甚至可以像“最近的咖啡店”一样模糊。
Gemini将激活手机上的Google地图,但您无需从包或口袋中取出手机即可使用。体验加载时短暂延迟后,眼镜会显示逐向导航。当您向前看时,会显示您的下一个转弯信息。但如果您需要在太空中确定方向,您可以俯视地面并在地图上看到您的蓝点。您还可以左右转动以在空间中旋转,就像您尝试让蓝点指向手机上的正确方向一样。
然后,如果您再次抬头,就可以继续行走,而地图不会妨碍您。
由于体验与手机上的Google地图相关,因此可以使用已保存的目的地(例如“家”和“工作”)。

我们还能够简单地使用眼镜来识别我们视野中的各种物体并提出有关它们的问题。最初,这款眼镜很难识别我们面前架子上的莫奈画作的复制品,但这是因为原型机没有自动启用相机——必须从应用程序中再次打开。尽管如此,在Gemini问了几个问题之后,即使我们靠近左下角的莫奈签名,它仍然看起来像莫奈。
其他测试则更加顺利,因为眼镜立即识别了架子上的植物,并回答了有关书中不同食谱的问题。尽管如此,我们还是在想,今天你可以使用Google Lens(或聊天机器人应用程序中集成的其他人工智能模型)来完成这些事情,尽管我们认为无需拿出手机就能完成这些事情是很有趣的。
Google表示,今年晚些时候,当它扩展其值得信赖的测试仪计划时,将分享更多有关其Android XR显示眼镜的信息。

与此同时,该公司相信音频将足以满足一些用户的需求,这也许是一个聪明的方式来解释它还没有准备好显示眼镜的事实,尽管在这方面有来自Meta和Snap的竞争。
与显示版本一样,音频眼镜还可以访问Google的Gemini AI,您可以通过眼镜框架扬声器私下听到这些声音。您可以通过眼镜执行一些操作,例如通过眼镜听音乐、按按钮拍照、拨打电话或点击手机应用程序,就像在未来的显示版本上一样。
我们演示的项目并不包括利用其他第三方应用程序,但眼镜将允许用户告诉Gemini执行“从这个食谱中获取原料并将其添加到我的购物清单”之类的操作。
在Google在活动主题演讲期间展示的另一个例子中,眼镜可以看到佩戴者正在炉子上做饭,并提供有关这顿饭的反馈,例如肉是否完全煮熟。