代币法案到期:行业内部争先恐后地管理人工智能失控的成本

整个行业的公司都开始对AI的价格犹豫不决。到4月份,Uber就耗尽了2026年全部AI编码预算。Microsoft在启用开发人员的Claude代码许可证几个月后又撤销了这些许可证。一位Priceline员工告诉TechCrunch,常规的Cursor合同续签费用要贵4-5倍。
尽管每个代币的价格已经下降,但更多人工智能采用和日益自主的代理的推动推动了代币消费越来越高。在2025年初大肆订阅无限量订阅服务的公司现在正忙着了解自己的资金去向、缩减支出,并弄清楚是否可以从预算残骸中挽救一些投资回报率。
与此同时,一个满足他们需求的市场正在形成。初创公司、老牌供应商和新的标准机构都在竞相为公司提供工具和语言来跟踪他们的支出。
“六个月前,我会与客户进行对话,内容都是‘它能做什么?它足够好吗?’”OpenAI的企业主管Alexander Embricos本周在纽约市的一次活动中告诉TechCrunch。 “我们现在的对话从来不是这个。现在的对话是,‘嘿,我们花了这么多钱。你有什么可见性?你有什么可审计性?你有什么代币控制?你的模型的效率是多少?’”
正是在这种背景下,Linux基金会本周公布了Tokenomics基金会的计划,这是一个新的标准机构,旨在围绕AI代币灌输与FinOps为云支出所做的相同的成本纪律。
“4月和5月,我开始听到公司说:‘天哪,我们的代币预算是2026年整个代币预算的3倍,而这只是4月份,’”Linux基金会下属项目FinOps基金会的执行董事J.R. Storment告诉TechCrunch。 “我们开始听到存在危机,整个谈话从令牌最大化和‘快点’转向‘我们需要护栏,我们如何控制它?’”
CEO们强烈要求他们的团队使用最好的模型并快速行动,不顾成本,在科技界听到了这样的呼声。 11月份发布的新型号,如Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和Google的Gemini 3 Pro给代理工具带来了重大改进,使消耗成倍增加。据报道,一家公司就是这样在忘记为员工设置使用限制后发现自己收到了5亿美元Claude的账单。
Priceline IT财务高级总监Chris Reed表示:“这就像强效可卡因主流病一样。”他指出,该公司已开始对某些群体设置象征性限制。 “他们让你尝试一下,让你着迷,现在你已经对它感激不尽了。”
工程运营平台Faros AI的CEO维塔利·戈登 (Vitaly Gordon) 表示,他最近与一位CTO交谈,这位CTO告诉他:“我的一位工程师上个月在代币上花了4万美元,我真的不知道是否应该阻止他,还是应该去告诉其他人都像他一样。”
Faros进行的三月份调查发现,在20,000名开发人员中,产出不断增加,但错误和重写也在增加。工程管理平台Jellyfish同样发现,使用最多代币的工程师的工作效率大约是使用人工智能较少的工程师的两倍,但他们花费的代币数量却是后者的10倍。
Jellyfish研究主管Nicholas Arcolano通过电子邮件告诉TechCrunch,人工智能支出呈爆炸式增长,很大程度上是由于代理功能,每个开发者的消费量在9个月内增长了约18.6倍。总而言之,这些统计数据使生产力状况比支出显示的更加模糊。
“极端支出是否有回报取决于所交付代码的最终商业价值(例如收入),而大多数公司仍然无法衡量这一点,”阿科拉诺说。
至少部分衡量问题在于当今人工智能的使用规模。
“跟踪云成本是一个每月数亿行的数据问题,”Storment说。 “跟踪代币成本是一个每月数万亿行的数据问题。你不能只是将其放入任何电子表格甚至基本工具中。你必须从根本上重新考虑你的工具、规格和会计系统才能做到这一点。”
在Priceline,里德已经看到了差异。他指出了供应商报告的使用情况与Priceline内部数据之间的问题。
“我的职业生涯始于电信费用管理,从电信到云再到人工智能,我看到了所有相同的相似之处,”他说。 “每当你推出新的东西时,计费错误以及审计和优化机会就已经成熟了。”
围绕这个问题开始形成一个市场。有一些纯粹的公司,例如Pay-i,跟踪、衡量和优化GenAI投资的成本和绩效。同时,Paid可以让开发人员跟踪成本、衡量使用情况,并据实际价值而不是订阅费向用户计费。
然后还有像Jellyfish、Waydev和Faros AI这样的公司,它们都提供AI代理监控来证明开发者工具的投资回报率。 Storment表示,FinOps基金会内的180家供应商中的大多数都倾向于这一领域。
现有分销的公司也在添加新功能以利用这个新市场。 Ramp最近涉足人工智能支出管理领域;Datadog和New Relic则增加了云成本管理、代币级可观测性和GPU监控等服务。在下周的FinOps X会议上,AWS预计将推出针对企业人工智能支出的新财务管理功能。
NEA的合伙人Tiffany Luck认为代币效率和可观察性可能会被添加到“利用层或应用程序层”。她指出,Factory是一家为企业生产人工智能代理的初创公司,该公司本周推出了一款模型路由器,可以自动为每项任务选择正确的模型。
Gordon预计前沿实验室和其他模型提供商将采用OpenRouter式的优化来推动对最便宜模型的查询——这一趋势已经出现在企业Claude账单上。
“关于你在Anthropic上花费多少钱的财务报告,即使你称之为Opus模型,部分支出也会花在十四行诗或俳句上,因为他们足够聪明,可以做到这一点,”戈登说。 “我认为这将变得越来越重要。”
但所有这些工具都是在没有通用语言或共享定义的情况下构建的,这些定义包括代币的成本、产生的内容以及如何比较不同供应商的支出。这就是代币经济学基金会希望发挥作用的地方。
基金会正在为“代币经济学”建立规范的定义和框架; AI代币使用和计费的开放标准、规范和指标;以及人工智能经济学的新指标,例如每智能成本或每瓦代币。它还计划定义代币工厂有效性和消费效率的指标。该组织计划于7月正式初创公司,并将在下周的FinOps X会议上宣布更多成员。
Salesforce首席可用性官Nishant Gupta在声明中表示:“从根本上来说,代币经济学比我们之前管理过的任何此类规模的产品都更加抽象和不透明。” “它需要与行业为云构建的运营能力不同的运营能力。”
也就是说,高盛预计到2030年,全球代币使用量将增加24倍。已经超出预算的公司现在需要解决方案,而基金会的第一个交付成果还需要几个月的时间。
“也许我们创造了蒸汽机,但我们还没有弄清楚装配线,”戈登说。
阿科拉诺认为,明智之举是广泛而适度地采用。
他说:“最好的投资回报率来自于将广泛的中间用户从低度使用率提升到中等使用率,而不是将大量用户推高。”
Russell Brandom和Tim Fernholz对本报告做出了贡献。