DeepSeek预览了新的人工智能模型,该模型与前沿模型“缩小了差距”

中国人工智能实验室DeepSeek推出了其最新大型语言模型DeepSeek V4的两个预览版本,这是去年V3.2模型和随之而来的席卷人工智能世界的R1推理模型的期待已久的更新。
该公司表示,DeepSeek V4 Flash和V4 Pro都是专家混合模型,每个模型都有100万个令牌的上下文窗口,足以允许在提示中使用大型代码库或文档。专家混合方法涉及每个任务仅激活一定数量的参数以降低推理成本。
Pro模型共有1.6万亿个参数(490亿个活跃参数),这使其成为可用的最大开放权重模型,超过了Moonshot AI的Kimi K 2.6(1.1万亿个)、MiniMax的M1(4560亿个),是DeepSeek V3.2(6710亿个)的两倍多。较小的V4 Flash有2840亿个参数(130亿个活动参数)。
DeepSeek表示,由于架构改进,这两个模型比DeepSeek V3.2更加高效、性能更高,并且在推理基准测试上几乎“缩小了”与当前领先模型(开放式和封闭式)的差距。
该公司声称,其新的V4-Pro-Max模型在推理基准测试中优于开源同行,并且在某些任务上超过了OpenAI的GPT-5.2和Gemini 3.0 Pro。在编码竞赛基准中,DeepSeek表示两种V4模型的性能“可与GPT-5.4相媲美”。
然而,这些模型在知识测试中似乎稍微落后于前沿模型,特别是OpenAI的GPT-5.4和Google的最新Gemini3.1 Pro。该实验室写道,这种滞后表明“发展轨迹落后于最先进的前沿模型大约3到6个月”。
V4 Flash和V4 Pro均仅支持文本,这与许多闭源同类产品不同,后者支持理解和生成音频、视频和图像。