AI资讯 / 发布于 2026.3.6 13:09

OpenAI推出GPT-5.4 Pro和Thinking版本

周四，OpenAI发布了GPT-5.4，这是一种新的基础模型，被誉为“我们最有能力、最高效的专业工作前沿模型”。除了标准版本之外，GPT-5.4还可以作为推理模型 (GPT-5.4 Thinking) 或针对高性能进行优化 (GPT-5.4 Pro)。

该模型的API版本将提供高达100万个令牌的上下文窗口，这是迄今为止OpenAI提供的最大上下文窗口。

OpenAI还强调了代币效率的提高，称GPT-5.4能够用比其前身少得多的代币来解决相同的问题。

新模型的基准测试结果显着提高，包括计算机使用基准测试OSWorld-Verified和WebArena Verified中的创纪录分数。新模型还在OpenAI的知识工作任务GDPval测试中获得了创纪录的83% 成绩。

据MercorCEOBrendan Foody的一份声明，GPT-5.4还在Mercor的APEX-Agents基准测试中处于领先地位，该基准旨在测试法律和金融方面的专业技能。

Foody在声明中表示：“[GPT-5.4] 擅长创建幻灯片、财务模型和法律分析等长期交付成果，与竞争性前沿模型相比，它能够提供最佳性能，同时运行速度更快，成本更低。”

GPT-5.4继续公司限制幻觉和事实错误的努力。 OpenAI表示，与GPT 5.2相比，新模型在个别声明中出错的可能性降低了33%，总体响应中包含错误的可能性降低了18%。