AI资讯 / 发布于 2026.4.24 22:09

DeepSeek预览了新的人工智能模型，该模型与前沿模型“缩小了差距”

中国人工智能实验室DeepSeek推出了其最新大型语言模型DeepSeek V4的两个预览版本，这是去年V3.2模型和随之而来的席卷人工智能世界的R1推理模型的期待已久的更新。

该公司表示，DeepSeek V4 Flash和V4 Pro都是专家混合模型，每个模型都有100万个令牌的上下文窗口，足以允许在提示中使用大型代码库或文档。专家混合方法涉及每个任务仅激活一定数量的参数以降低推理成本。

Pro模型共有1.6万亿个参数（490亿个活跃参数），这使其成为可用的最大开放权重模型，超过了Moonshot AI的Kimi K 2.6（1.1万亿个）、MiniMax的M1（4560亿个），是DeepSeek V3.2（6710亿个）的两倍多。较小的V4 Flash有2840亿个参数（130亿个活动参数）。

DeepSeek表示，由于架构改进，这两个模型比DeepSeek V3.2更加高效、性能更高，并且在推理基准测试上几乎“缩小了”与当前领先模型（开放式和封闭式）的差距。

该公司声称，其新的V4-Pro-Max模型在推理基准测试中优于开源同行，并且在某些任务上超过了OpenAI的GPT-5.2和Gemini 3.0 Pro。在编码竞赛基准中，DeepSeek表示两种V4模型的性能“可与GPT-5.4相媲美”。

然而，这些模型在知识测试中似乎稍微落后于前沿模型，特别是OpenAI的GPT-5.4和Google的最新Gemini3.1 Pro。该实验室写道，这种滞后表明“发展轨迹落后于最先进的前沿模型大约3到6个月”。

V4 Flash和V4 Pro均仅支持文本，这与许多闭源同类产品不同，后者支持理解和生成音频、视频和图像。

← 返回列表