OpenAI が主要テック企業と共同でAIスーパーコンピュータ向けネットワークプロトコルMRCを開発

要約
OpenAI は AMD、Broadcom、Intel、Microsoft、NVIDIA と共同で、AIスーパーコンピュータのネットワークボトルネック解決を目的とした新しいオープンソースネットワークプロトコル「MRC」を開発した。このプロトコルは、GPU 間で数百のパス経由で同時にデータを送信できる革新的な仕組みを採用している。従来のネットワーク構成では 3-4 層のスイッチレイヤーが必要だったが、MRC では わずか 2 層で 100,000 以上の GPU を接続可能となり、大幅な省電力とコスト削減を実現している。この技術は既に OpenAI の Stargate スーパーコンピュータで実装され、稼働している。
洞察・気づき
この開発は AI インフラ業界において複数の重要な意味を持つ。まず、OpenAI が競合他社を含む主要企業と技術協力することで、AI スーパーコンピュータの標準化と効率化が進む可能性がある。また、オープンソースでの公開により、業界全体でのイノベーション加速が期待される。技術面では、GPU クラスター間の通信効率向上により、より大規模な AI モデルの訓練が現実的になり、AI 開発のさらなる進歩につながるだろう。さらに、消費電力とコスト削減により AI インフラの運用がより持続可能になり、より多くの組織が大規模 AI システムにアクセスできるようになる可能性がある。