正在为机器重建互联网

长期以来,云基础设施都是围绕人类以稳定且可预测的方式进行搜索、点击、滚动和流式传输而设计的。人工智能代理的行为有所不同。它们可以释放大量活动,初创公司多个子代理,在几秒钟内查询数百个数据库、搜索文档和调用API,然后在它们到达时迅速消失。
在此前提下,Amazon正在重新设计其云基础设施的核心部分。周四,AWS推出了下一代OpenSearch Serverless,这是一个完全托管的搜索和矢量数据库,本质上是一个用于大规模存储和检索信息的系统,专为代理工作负载而设计。 AWS表示,新系统可以在代理触发任务时立即扩大规模,并在空闲时缩小到零。
此次发布反映了整个科技行业越来越多的认识:最初为人类驱动的互联网设计的基础设施在代理人数日益增多的世界中效果不佳。
虽然人工智能代理在互联网活动中所占的比例仍然相对较小,但机器生成的流量已经相当可观,并且有望增长。 Cloudflare表示,过去六个月中,机器人流量占HTTP总流量的31%。在此期间,人工智能爬虫、搜索引擎和助手约占所有机器人请求的四分之一。
Cloudflare高级产品经理Lai Yi Ohlsen向TechCrunch表示:“到2027年上半年,非人类流量将超过人类流量。”
在上周的Google I/O开发者大会上,该公司表示用户将能够开始将任务委托给人工智能系统,例如研究购买、预订旅行、浏览网页以及与应用程序交互。但责任并不仅仅停留在以消费者为中心的人工智能代理身上。企业越来越多地在内部和为客户部署代理,在幕后创建新型机器生成的流量。
因此,云提供商和基础设施公司一直在考虑如何使为人类构建的系统适应不断自主地检索信息、调用工具并生成机器对机器流量的代理世界。
这就是AWS的新OpenSearch Serverless的用武之地。
“时机很简单。代理正在从实验转向生产,他们创建了以前的基础设施根本无法设计的流量模式,”Amazon OpenSearch Service总经理Tia White告诉TechCrunch。 “它们在没有警告的情况下激增,它们在没有通知的情况下闲置,企业需要能够跟上的搜索,而无需为空或闲置的计算付费。”
新一代的关键技术变化在于它将计算与存储分离,允许计算在几秒钟内扩展以适应代理流量突发并缩小到零,因此客户在代理空闲时支付0美元。
“以前,即使在我们之前的无服务器版本中,也必须至少有一个实例可操作和运行,因为存储和计算是耦合的,”怀特说。 “你不能只是按照你需要的速度自动初创公司[计算],所以你总是为你的工作负载保留空闲计算,无论你是否使用它。”
可以把它想象成总是为停车位付费,即使你没有使用它。借助AWS升级后的Serverless,这更像是为计费停车位付费。
发布时,OpenSearch Serverless将与Vercel和Kiro等人工智能开发平台本地集成,因此开发人员可以为代理部署可用于生产的搜索和矢量后端,而无需管理基础设施。
这种转变正在整个云行业中出现。 Databricks和Snowflake正在将自己重新定位为企业数据的人工智能内存和检索系统。 Microsoft已推出Azure更新,旨在处理AI代理突发并在代理之间共享内存。 Cloudflare与Amazon类似,上个月推出了旨在为代理提供持久环境和即时可扩展性的基础设施。
部署人工智能代理的公司越多,围绕机器生成的工作负载重新设计基础设施的压力就越大,这反过来又可以使代理更便宜、更容易大规模部署。
正在加载播放器...