OpenAI推出GPT-5.4 Pro和Thinking版本

周四,OpenAI发布了GPT-5.4,这是一种新的基础模型,被誉为“我们最有能力、最高效的专业工作前沿模型”。除了标准版本之外,GPT-5.4还可以作为推理模型 (GPT-5.4 Thinking) 或针对高性能进行优化 (GPT-5.4 Pro)。

该模型的API版本将提供高达100万个令牌的上下文窗口,这是迄今为止OpenAI提供的最大上下文窗口。

OpenAI还强调了代币效率的提高,称GPT-5.4能够用比其前身少得多的代币来解决相同的问题。

新模型的基准测试结果显着提高,包括计算机使用基准测试OSWorld-Verified和WebArena Verified中的创纪录分数。新模型还在OpenAI的知识工作任务GDPval测试中获得了创纪录的83% 成绩。

据MercorCEOBrendan Foody的一份声明,GPT-5.4还在Mercor的APEX-Agents基准测试中处于领先地位,该基准旨在测试法律和金融方面的专业技能。

Foody在声明中表示:“[GPT-5.4] 擅长创建幻灯片、财务模型和法律分析等长期交付成果,与竞争性前沿模型相比,它能够提供最佳性能,同时运行速度更快,成本更低。”

GPT-5.4继续公司限制幻觉和事实错误的努力。 OpenAI表示,与GPT 5.2相比,新模型在个别声明中出错的可能性降低了33%,总体响应中包含错误的可能性降低了18%。

← 上一篇文章 Meta的隐私政策引发争议:Ray-Ban Meta用户不知不觉中为AI模型贡献数据 下一篇文章 → Google表示2025年跟踪的所有零日漏洞中有一半针对有缺陷的企业技术

← 返回列表