OpenAI携手硬件巨头发布MRC协议，欲终结GPU闲置浪费

5 月 6 日，人工智能领军企业 OpenAI 联合 AMD、博通（Broadcom）、英特尔、微软及英伟达等多家行业巨头，共同推出了一项名为“多路径可靠连接”（Multipath Reliable Connection，简称 MRC）的全新开放网络协议。这一动作标志着科技界在解决超大规模 AI 集群效率瓶颈上迈出了关键一步。

该协议的核心目标在于通过技术手段优化大型 AI 训练集群的运行表现。在以往的模型训练中，由于网络连接的波动或分配不均，昂贵的 GPU 算力往往会因为等待数据传输而产生闲置，造成了极大的资源浪费。MRC 协议通过提供更具可靠性的多路径连接方案，旨在显著提升数据传输的稳定性，从而大幅降低功耗并提高整体计算效率。

据了解，MRC 协议并非仅停留在理论阶段，目前已在 OpenAI 内部得到全面应用。所有用于开发前沿模型的大型超级计算机均已部署该协议，其中涵盖了位于美国德克萨斯州阿比林的甲骨文云基础设施（OCI）站点，以及微软旗下的 Fairwater 超级计算机集群。

随着 AI 模型参数规模的持续攀升，底层基础设施的效率优化已成为各家大厂争夺的新战场。此次 OpenAI 选择与多家硬件芯片厂商及云服务商联合发布开放协议，不仅是为了解决自身训练成本问题，更展现了其试图主导 AI 时代网络通信标准的意图。对于行业而言，MRC 的发布或许将推动超大规模算力集群进入一个更高效、更绿色的新阶段。