科技公司能学会喜欢更便宜的人工智能模型吗?

人工智能的繁荣建立在一次基本假设之上:模型越大,功能越强大,并且最强大的模型获胜。现在,业界即将了解如果这一假设开始被打破会发生什么。

安装成本已经迫使用户重新考虑更小、更便宜的型号。这种注重成本的购物模式是新的,目前尚不清楚它将如何影响该行业,但影响可能会很大。

Coinbase联合创始人布莱恩·阿姆斯特朗 (Brian Armstrong) 做出了最好的预测,这将导致绝大多数任务转移到更便宜的模型。

“对智能的需求接近无限,但80% 的工作负载将在12-18个月内运行在99% 便宜的型号上,”阿姆斯特朗在X上写道。 “20% 的工作负载仍将在最新一代模型上运行,其中IQ最大化非常重要。”

如果阿姆斯特朗的预测成真,人工智能行业将发生多么重大的转变,这一点都不为过。

在此之前,大多数人工智能公司都在质量上进行竞争,这意味着默认使用最先进的可用模型。如果这些相同的工作可以通过更便宜的模型来处理而不影响质量,那么这将意味着人工智能经济学的巨大转变。至关重要的是,大部分节省的资金将来自大型实验室的口袋,在OpenAI和Anthropic即将进行IPO时对他们造成财务打击。

这对行业来说可能是一场巨大的变化,其基础是一个基本问题:公司是否准备好转向更小的型号?

初步测试表明,当系统布置正确时,更便宜的型号可以在不牺牲质量的情况下投入使用。在合法人工智能工具Harvey最近的一项测试中,该公司能够在不降低质量的情况下将推理成本降低3倍。该测试与推理平台Fireworks AI合作进行,结合了Claude Opus和Fireworks的GLM 5.1,并转向Opus来执行最密集的任务。结果是服务器时间和总体成本方面的负载显着降低。

Harvey联合创始人Gabe Pereyra在谈到他的初创公司提供的人工智能法律服务时告诉TechCrunch:“质量是第一位的,在法律领域也是如此。” “然而,质量的定义正在从简单地使用最强大的模型发展到使用能够最有效地获得正确答案的最佳模型。”

这种趋势通常是据主要实验室与中国模型或开放重量实验室的比较来界定的,但这忽略了更重要的一点。真正的区别不在于专有模型和开放模型之间;而是在专有模型和开放模型之间。它介于大型模型和小型模型之间。您可以通过从GPT-5.5切换到DeepSeek的V4 Flash来节省资金,但切换到GPT-5.4-mini也同样有效。

大型实验室的内部推理与独立服务的开放权重模型之间正在进行着一场激烈的价格战。对于小型与大型这一更大的问题,哪种小型模型胜出并不重要。

所有这些似乎都是显而易见的——当然,您不应该使用不必要的计算量——但这与迄今为止主导行业的扩展优先方法背道而驰。受到惨痛教训的启发,实验室努力训练尽可能计算密集型的模型,推动人工智能模型的前沿发展。由于价格受到投资者的大力补贴,客户没有理由选择除了最先进的选择之外的任何选择。

随着代币价格上涨和补贴放缓,用户首次面临成本压力。我们不知道新的成本压力是否真的会促使企业用户转向更小的型号。他们可以通过减少呼叫、使用更少的上下文或干脆放弃最没有希望的部署来轻松节省成本。

但如果事实证明大多数部署都可以在较小的模型上运行,则可能会严重抑制不断增长的推理需求,并引发有关如何证明训练前沿模型的成本合理性的新问题。

← 上一篇文章 WWDC 2026:有关Siri AI、iOS 27、Apple Intelligence等的所有内容均已公布

← 返回列表