Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
今、GPUが熱い - それを冷やす技術
Search
Yasutaka OHMURA
September 26, 2025
1
130
今、GPUが熱い - それを冷やす技術
Yasutaka OHMURA
September 26, 2025
Tweet
Share
More Decks by Yasutaka OHMURA
See All by Yasutaka OHMURA
Amazon VPC Lattice 最新アップデート紹介 - PrivateLink も似たようなアップデートあったけど違いとは
bigmuramura
1
850
AWSで挑むゲノム解析 : 普段使わない技術を知ろう
bigmuramura
0
790
「S3 Express One ZoneとEFSアーカイブを少しだけ詳しくなろう」re:Growth 2023 in Sapporo
bigmuramura
0
1k
VPC間通信ができる新サービスVPC Lattice。ん?似たようなサービス他にもなかったっけ? サービスを一度整理してみましょう
bigmuramura
4
5.9k
Featured
See All Featured
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
36
2.5k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
It's Worth the Effort
3n
187
28k
Bash Introduction
62gerente
615
210k
Building Applications with DynamoDB
mza
96
6.6k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Code Reviewing Like a Champion
maltzj
525
40k
A designer walks into a library…
pauljervisheath
208
24k
Git: the NoSQL Database
bkeepers
PRO
431
66k
Gamification - CAS2011
davidbonilla
81
5.4k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Transcript
今、GPUが熱い それを冷やす技術 ⼤村 保貴 クラスメソッド株式会社 クラウド事業本部 コンサルティング部
⾃⼰紹介 2 大村 保貴 (Yasutaka Ohmura) クラスメソッド株式会社 クラウド事業本部 コンサルティング部 ソリューションアーキテクト
出身 • 網走市 役割 • お客様のクラウド活用推進のための伴走支援 • 専門はHPC(スパコン)、ライフサイエンス少々 経歴 • オンプレITインフラの設計構築→ 自社IoTサービスの構築運用 → クラスメソッド 受賞 • Japan AWS Top Engineers (Services) 2021, 2023 - 2025 • Japan AWS All Certifications Engineers 2021 - 2025
今、GPUが熱い
4 ⽣成 AI への⺠間投資は爆発的に増加しています。 引⽤: The 2025 AI Index Report
⽣成 AI ブーム 2024年の⽣成 AI への⺠間投資額は 339 億ドル 2022年⽐で 8.5 倍以上に増加 ChatGPT 以降、企業の AI 投資が加速
NVIDIA の株価も熱い 5 GPU需要を背景に、NVIDIA社の市場価値も上昇しています 引⽤: Google Finance GPU 需要の爆発で株価も⾼騰 時価総額は
4 兆ドルを突破 AI の進化をハードウェアが⽀えている
GPU の温度が熱い! 6 ⾼性能化する GPU の発熱を冷やすための技術 AWS 最新の液体冷却システムを中⼼に紹介します 空冷の限界を迎える...
最近の GPU サーバー事情
NVIDIA GB200 NVL72 8 最新のNVIDIA GB200 NVL72は、1ラック全体で1つの巨⼤なGPUとして動作します 引⽤: AI Factory
for the New Industrial Revolution | NVIDIA GTC24
NVIDIA GB200 NVL72 9 2 ラックに分けて 1 つの GPU を構成パターンも提供されています
引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering Frontier AI at Scale
NVIDIA GB200 NVL72 10 消費電⼒が⾼すぎて⼀般的なデータセンターに 1 ラック構成で置けない 参考: NVIDIA GB200
スーパーチップと液冷サーバーおよびキャビネットの紹介 GPU 1チップ 約 1.2kW(1200W) 標準的な CPU サーバー消費電力 約 12kW/ラック 多くのデータセンターの標準的なラック 最大 60kW/ラック まで対応 GB200 NVL72 の消費電力 約 120kW/ラック 一部データセンターの対応しているラック 135kW 〜
ドライヤー100台 11 1ラックの消費電⼒は、家庭⽤ドライヤー100台を同時に使うのと同じくらい • ドライヤーの消費電⼒:約1.2kW (1200W) • GPU 1チップ ≒
ドライヤー 1台 • GB200 NVL72 1ラック ≒ ドライヤー 100台 × 100
空冷の限界 12 仮に空気でGPUを冷やすなら、、、 参考: NVIDIA Blackwell プラットフォームが水の使用効率を 300 倍以上改善 データセンターの温度を氷点下まで下げるか、
強⾵レベルの⾵速で熱を逃がし続ける 従来の「空気」で冷やすのは⾮現実的になりました
液体冷却
なぜ「液体」? 14 空気の約1000倍の密度を持つ液体は、熱を奪う効率が圧倒的に良い 密度 運べる熱量 空気 低い 小さい 液体 高い
大きい 参考: NVIDIA Blackwell プラットフォームが水の使用効率を 300 倍以上改善
液体冷却の⽅式 15 L2L(Liquid to Liquid) DLC(Direct Liquid Cooling) L2A(Liquid to
Air)
液体冷却システムの導⼊課題(L2A) 16 床下に冷却⽔の配管を張り巡らせる必要があり、導⼊に時間がかかる 引⽤: AI Factory for the New Industrial
Revolution | NVIDIA GTC24
AWSの場合 17 市場の既製品では、AWSが求める「スピード」と「スケール」を実現できませんでした 参考: AWS’s New Liquid Cooling Solution Rattled
the Market—But Is It Truly Disruptive? • リードタイム: 新規データセンター建設には数年かかる • 拡張性: 既製品はAWSの巨⼤なスケール要求に合わない • 効率⾯: 既製品ではDCのフロアスペースを取りすぎる • 改修コスト: 既存データセンターの⼤幅な改修が必要
液体冷却システムを作った 18 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering Frontier
AI at Scale IRHX(In-Row Heat Exchanger)の登場
設計思想 19 ラックのためにデータセンターを設計する必要がない 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
IRHX 20 3つのコンポーネントに分かれています 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale ⽔配分ユニット ポンプ ファンコイル
IRHX 21 サーバラック横の⽔配分キャビネットからサーバーラックへ直接配管 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
IRHX 22 ポンプから送り出された冷却液で熱源(GPUのチップ)を直接冷却 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
IRHX 23 熱を奪った冷却液はラック隣の⽔配分キャビネットへ戻り 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
IRHX 24 ポンプ横のファンで熱くなった冷却液を冷やし、最終的に熱は既存の空調システムで処理 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
拡張性が⾼い 25 将来GPUがもっと熱くなっても、ファンを追加するだけで対応できる 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
最近の製品(Delta's Air-Assisted Liquid Cooling) 26 引⽤: 革新的冷却システム | Air-Assisted Liquid
Cooling with Side Car Heat Exchanger ラックの隣に液冷ユニットを配置する構成
まとめ 27 • ⽣成AIブームでGPU需要が爆発 • 最新のGPUは液冷必須 • AWSは既存のDCを活かした設計で液体冷却システム(IRHX)を開発し解決した
None