国产大模型领域迎来重磅更新。4月21日,月之暗面(Moonshot AI)正式发布并开源了其最新旗舰模型 Kimi K2.6。这款模型在编程能力、长程任务处理以及多Agent(智能体)协作方面实现了显著跨越,目前已在官网、APP、API及Kimi Code编程助手同步上线。

在衡量大模型综合实力的多项权威测试中,Kimi K2.6展现出了硬核的竞技状态。无论是在被誉为“人类最后考试”的高难度基准Humanity's Last Exam,还是考察真实软件工程能力的SWE-Bench Pro中,其表现均已步入行业第一梯队。数据监测显示,K2.6的性能已能与GPT-5.4、Claude Opus4.6等国际顶尖闭源模型正面交锋。

image.png

作为该系列迄今最强的编程模型,K2.6在长程编码任务上的耐力惊人。在实测中,它可以保持连续13小时不间断的编码工作,单次任务可编写或修改超过4000行代码,能够胜任复杂系统的开发与迭代。得益于视觉能力与代码能力的深度融合,该模型还能独立交付具有专业设计感的Web应用。内部评测数据显示,其代码能力较上一代版本提升了约20%。

image.png

值得关注的是,K2.6展现了极佳的本地化泛化能力。通过使用Zig语言优化推理流程,Kimi K2.6已支持在Mac设备上本地部署。在长达12小时的连续运行测试中,其吞吐量从初始的15tokens/s飙升至193tokens/s,推理效率比行业主流工具LM Studio高出约20%,大幅降低了开发者使用高标准模型的门槛。

在协同办公领域,Kimi K2.6引入了强大的Agent集群架构。该系统支持多达300个子Agent并行作业,能够处理约4000个协作步骤。这意味着用户只需输入一个复杂指令,模型即可调度不同专长的智能体,一次性完成从深度搜素、文档分析到生成网页、PPT和表格的全链路交付,极大提升了端到端的任务执行质量。