据报道,在
核心突破:让模型成为自己的“研究员”
自我迭代循环: 研发团队将 M2的早期版本引导为研究型 Agent,让模型参与到下一代模型的迭代中。它能自主构建复杂的 Agent Harness,驱动强化学习并优化自身 Memory,实现了30-50% 工作流的自动化。
编程与办公巅峰: 在编程测试 SWE-Pro 中,M2.7以 56.22% 的正确率追平了 GPT-5.3-Codex;在专业办公领域,其 GDPval-AA 得分位居开源模型首位。
极致技能遵循: 即便是在处理超过2000Token 的复杂 Skills 场景下,该模型依然能保持 97% 的高遵循率。
昇腾加持:软硬协同消除算力瓶颈
为了匹配
通信加速: 针对模型创新的 FlashComm 序列切分,引入了 ReduceScatter 和 AllGather 通信优化,大幅提升数据传输效率。
算子融合: 深度优化 Transformer Attention 全链路融合算子与 MoE 大融合算子,彻底消除了中间张量的读写开销。
吞吐性能提升: 在多 DP 并发场景下实现自适应负载均衡,显著降低了预填充(prefill)对解码(decode)的干扰。
落地应用:从软件工程到互动娱乐
随着
软件工程: 覆盖日志分析、Bug 定位、代码重构及安卓开发等深层领域。
互动娱乐: 通过交互系统 OpenRoom,将 AI 互动置入 Web GUI 空间,强化了人设保持与对话的一致性。
专业办公: 凭借强大的环境交互能力,交付高度复杂的生产力任务。
结语:算力底座决定进化速度
从