全球大模型技术向“具身智能”与高级智能体演进的步伐正在全面加速。 6 月 2 日,阿里通过千问大模型官方渠道宣布,正式推出新一代多模态智能体模型——Qwen3.7-Plus。这不仅是通义千问系列在多模态领域的又一次技术飞跃,也标志着国产大模型在端侧与复杂工作流应用上迎来了核心底座的迭代。

作为本次升级的核心看点,Qwen3.7-Plus在承袭了Qwen3. 7 强大的原生文本处理能力的基础上,对视觉-语言能力(Vision-Language)进行了全方位的高阶进化。这意味着模型不仅能更精准地“看懂”复杂的图像与视频内容,还能将这种精细化的视觉感知转化为深度的逻辑推理,极大地拓宽了多模态交互的实际应用边界。

除了视觉能力的蜕变,该模型依然保持了在智能体(Agent)核心链路上的顶尖硬核实力。在编程代码生成、复杂工具调用(Tool-use)以及高阶生产力工作流(Productivity Workflows)等方面,Qwen3.7-Plus表现出了极高的任务连续性与决策鲁棒性,能够更丝滑地适应企业级自动化任务和长时序的智能调度场景。

业内分析人士指出,大模型下半场的竞争已经明确转向了多模态与智能体化。阿里此番通过Qwen3.7-Plus将视觉理解与智能体动作规划进行深度融合,不仅进一步拉高了开源与商业化模型的性能天花板,也为后续更广泛的产业智能化和具身机器人应用落地提供了更具想象力的计算底座。