中国移动发布MoMA平台：开启AI“水电煤”时代，Token成本降幅达30%

在 2026 移动云大会上，中国移动正式推出了移动模型服务平台——MoMA。这一平台的发布，标志着大模型应用正加速从“实验室”走向“千行百业”，力求让AI像水和电一样实现“随处可用”。

MoMA平台的核心优势在于其强大的聚合能力。通过统一的API网关，用户只需一次接入，即可调用包括中国移动自研“九天”基座大模型在内的 300 多款业界主流模型。无论是国产之光DeepSeek、通义千问、Kimi，还是豆包、GLM等优质资源，均已悉数入驻。

这种集成模式覆盖了文本生成、语音处理及多模态理解等全方位能力，能精准匹配金融、教育、医疗等复杂业务场景。

为了解决企业在不同模型间切换的痛点，MoMA首创了智能路由引擎。系统能够自动识别用户需求，在“成本优先”、“效果优先”与“均衡优先”三种策略间灵活切换。

值得关注的是，该平台具备极高的业务连续性保障：当某个模型出现故障或限流时，MoMA可实现秒级自动切换。同时，基于国产算力的自研推理引擎配合智能缓存、上下文复用等技术，使单位Token成本压降了30%以上，资源占用率降低超过50%。

针对政务、金融等对数据隐私极度敏感的行业，MoMA推出了“机密模型”服务。通过硬件隔离技术将模型部署在机密容器中，实现了计算过程的“可用不可见”，确保从芯片到应用的全链路数据安全。

在运营层面，MoMA引入了集约化管理模式，实现Token全生命周期的精准监控。平台支持流式实时计费，用户使用产生的账单延迟不超过 1 分钟，真正做到了“即用即付”。

此外，全链路可观测能力让开发者能够实时监测时延、吞吐量及GPU资源占用等关键指标。这种清晰的损耗记录和风险管控机制，不仅杜绝了资源挤占，也为企业的AI投入产出比提供了直观的决策依据。