(RDMA) ②NVLink それぞれ要件が違ったネットワークが求められる ① CPUセントリックなインターネットなどの通信: Lossy ② サーバー内のGPU間通信はPCIeよりも広帯域なNVLink4で通信 ③ サーバーを跨ぐGPU間通信は①と独立したロスレス低遅延: Lossless ④ ストレージネットワーク(NFS / GPDS:GPU Direct Storage) ⑤ BMC/IPMIなどの管理用ネットワーク NIC GPU CPU Mem NIC NVMe NIC NIC Interconnect SW CPU GPU NIC GPU CPU Mem NIC NVMe NIC NIC PCI switch Storage SW Internet SW Management PCI switch ④NFS / GDS NVSwitch NVSwitch
(RDMA) ②NVLink ① CPUセントリックなインターネットなどの通信: Lossy ▪ Hugging FaceやGCS/S3からモデルやデータセットをダウンロード ▪ Kubernetes Pod間通信 ② サーバー内のGPU間通信はPCIeよりも広帯域なNVLink4で通信 ▪ NVLink4の片方向の総帯域は450GBytes/sec (25Gx18) ▪ GPU内部サーバー内のNVSwitch3でSHARPが利用可能 NIC GPU CPU Mem NIC NVMe NIC NIC Interconnect SW CPU GPU NIC GPU CPU Mem NIC NVMe NIC NIC PCI switch Storage SW Internet SW Management PCI switch ④NFS / GDS NVSwitch NVSwitch
(RDMA) ②NVLink ③ サーバーを跨ぐGPU間通信は①と独立したロスレス低遅延: Lossless ▪ GPU Direct RDMA: CPUを介さずリモートホストGPUメモリにRDMA -> ACSは無効にしてRoot Complexを経由させない ④ ストレージネットワーク(NFS / GPDS:GPU Direct Storage) ▪ コンテナにアタッチされたファイルストレージ(Volume)との通信 ▪ 学習用データセットの読み込みやチェックポイントの書き出し ⑤ BMC/IPMIなどの管理用ネットワーク NIC GPU CPU Mem NIC NVMe NIC NIC Interconnect SW CPU GPU NIC GPU CPU Mem NIC NVMe NIC NIC PCI switch Storage SW Internet SW Management PCI switch ④NFS / GDS NVSwitch NVSwitch
(RDMA) ②NVLink それぞれ要件が違ったネットワークが求められる ① CPUセントリックなインターネットなどの通信: Lossy ② サーバー内のGPU間通信はPCIeよりも広帯域なNVLink4で通信 ③ サーバーを跨ぐGPU間通信は①と独立したロスレス低遅延: Lossless ④ ストレージネットワーク(NFS / GPDS:GPU Direct Storage) ⑤ BMC/IPMIなどの管理用ネットワーク NIC GPU CPU Mem NIC NVMe NIC NIC Interconnect SW CPU GPU NIC GPU CPU Mem NIC NVMe NIC NIC PCI switch Storage SW Internet SW Management PCI switch ④NFS / GDS NVSwitch NVSwitch
(RDMA) ②NVLink それぞれ要件が違ったネットワークが求められる ① CPUセントリックなインターネットなどの通信: Lossy ▪ Hugging FaceやGCS/S3からモデルやデータセットをダウンロード ▪ Kubernetes Pod間通信 ② サーバー内のGPU間通信はPCIeよりも広帯域なNVLink4で通信 ▪ NVLink4の片方向の総帯域は450GBytes/sec (25Gx18) ▪ GPU内部サーバー内のNVSwitch3でSHARPが利用可能 ③ サーバーを跨ぐGPU間通信は①と独立したロスレス低遅延: Lossless ▪ GPU Direct RDMA: CPUを介さずリモートホストGPUメモリにRDMA -> ACSは無効にしてRoot Complexを経由させない ④ ストレージネットワーク(NFS / GPDS:GPU Direct Storage) ▪ コンテナにアタッチされたファイルストレージ(Volume)との通信 ▪ 学習用データセットの読み込みやチェックポイントの書き出し ⑤ BMC/IPMIなどの管理用ネットワーク NIC GPU CPU Mem NIC NVMe NIC NIC Interconnect SW CPU GPU NIC GPU CPU Mem NIC NVMe NIC NIC PCI switch Storage SW Internet SW Management PCI switch ④NFS / GDS NVSwitch NVSwitch