5 月 6 日,人工智能领军企业 OpenAI 联合 AMD、博通(Broadcom)、英特尔、微软及英伟达等多家行业巨头,共同推出了一项名为“多路径可靠连接”(Multipath Reliable Connection,简称 MRC)的全新开放网络协议。这一动作标志着科技界在解决超大规模 AI 集群效率瓶颈上迈出了关键一步。

该协议的核心目标在于通过技术手段优化大型 AI 训练集群的运行表现。在以往的模型训练中,由于网络连接的波动或分配不均,昂贵的 GPU 算力往往会因为等待数据传输而产生闲置,造成了极大的资源浪费。MRC 协议通过提供更具可靠性的多路径连接方案,旨在显著提升数据传输的稳定性,从而大幅降低功耗并提高整体计算效率。

据了解,MRC 协议并非仅停留在理论阶段,目前已在 OpenAI 内部得到全面应用。所有用于开发前沿模型的大型超级计算机均已部署该协议,其中涵盖了位于美国德克萨斯州阿比林的甲骨文云基础设施(OCI)站点,以及微软旗下的 Fairwater 超级计算机集群。

随着 AI 模型参数规模的持续攀升,底层基础设施的效率优化已成为各家大厂争夺的新战场。此次 OpenAI 选择与多家硬件芯片厂商及云服务商联合发布开放协议,不仅是为了解决自身训练成本问题,更展现了其试图主导 AI 时代网络通信标准的意图。对于行业而言,MRC 的发布或许将推动超大规模算力集群进入一个更高效、更绿色的新阶段。