在 2026 移动云大会上,中国移动正式推出了移动模型服务平台——MoMA。这一平台的发布,标志着大模型应用正加速从“实验室”走向“千行百业”,力求让AI像水和电一样实现“随处可用”。
一站式集成: 300 余款主流模型“拎包入住”
MoMA平台的核心优势在于其强大的聚合能力。通过统一的API网关,用户只需一次接入,即可调用包括中国移动自研“九天”基座大模型在内的 300 多款业界主流模型。无论是国产之光DeepSeek、通义千问、Kimi,还是豆包、GLM等优质资源,均已悉数入驻。
这种集成模式覆盖了文本生成、语音处理及多模态理解等全方位能力,能精准匹配金融、教育、医疗等复杂业务场景。
智能调度:让模型调用告别“选择困难”
为了解决企业在不同模型间切换的痛点,MoMA首创了智能路由引擎。系统能够自动识别用户需求,在“成本优先”、“效果优先”与“均衡优先”三种策略间灵活切换。
值得关注的是,该平台具备极高的业务连续性保障:当某个模型出现故障或限流时,MoMA可实现秒级自动切换。同时,基于国产算力的自研推理引擎配合智能缓存、上下文复用等技术,使单位Token成本压降了30%以上,资源占用率降低超过50%。
安全底座:首推“机密模型”服务
针对政务、金融等对数据隐私极度敏感的行业,MoMA推出了“机密模型”服务。通过硬件隔离技术将模型部署在机密容器中,实现了计算过程的“可用不可见”,确保从芯片到应用的全链路数据安全。
闭环运营:算力消费透明化
在运营层面,MoMA引入了集约化管理模式,实现Token全生命周期的精准监控。平台支持流式实时计费,用户使用产生的账单延迟不超过 1 分钟,真正做到了“即用即付”。
此外,全链路可观测能力让开发者能够实时监测时延、吞吐量及GPU资源占用等关键指标。这种清晰的损耗记录和风险管控机制,不仅杜绝了资源挤占,也为企业的AI投入产出比提供了直观的决策依据。