Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GPU NW BoF / JANOG 55
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Preferred Networks
PRO
January 23, 2025
Technology
180
1
Share
GPU NW BoF / JANOG 55
JANOG 55 の GPU NW BoF (2025/1/24) でのPreferred Networksのスライドです。
Preferred Networks
PRO
January 23, 2025
More Decks by Preferred Networks
See All by Preferred Networks
国産生成AI PLaMoを支える事後学習と推論最適化
pfn
PRO
10
3.5k
Japanese SimpleQA: 日本語における事実に基づいた回答能力の評価ベンチマーク
pfn
PRO
1
240
Headlampと独自プラグインを活用したKubernetesダッシュボードの機能拡張
pfn
PRO
2
260
AI/MLのマルチテナント基盤を支えるコンテナ技術
pfn
PRO
6
1.6k
単一Kubernetesクラスタで実現する AI/ML 向けクラウドサービス
pfn
PRO
1
880
2.5x Speedup of GPSampler by Batching (PFN 2025 夏期国内インターンシップ)
pfn
PRO
0
110
ストレージエンジニアの仕事と、近年の計算機について / 第58回 情報科学若手の会
pfn
PRO
7
1.7k
エンタメとAIのための3Dパラレルワールド構築(GPU UNITE 2025 特別講演)
pfn
PRO
0
1.5k
マルチテナントKubernetesコンテナ基盤 / 京都大学学術情報メディアセンターセミナー
pfn
PRO
3
2.5k
Other Decks in Technology
See All in Technology
Contract One Engineering Unit 紹介資料
sansan33
PRO
0
16k
AI와 협업하는 조직으로의 여정
arawn
0
230
[OpsJAWS 40]リリースしたら終わり、じゃなかった。セキュリティ空白期間をAWS Security Agentで埋める
sh_fk2
3
230
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
6
74k
EarthCopilotに学ぶマルチエージェントオーケストレーション
nakasho
0
290
Master Dataグループ紹介資料
sansan33
PRO
1
4.6k
こんなアーキテクチャ図はいやだ / Anti-pattern in AWS Architecture Diagrams
naospon
1
440
コミュニティ・勉強会を作るのは目的じゃない
ohmori_yusuke
0
120
社内エンジニア勉強会の醍醐味と苦しみ/tamadev
nishiuma
0
180
Choose your own adventure in agentic design patterns
glaforge
0
130
最新の脅威動向から考える、コンテナサプライチェーンのリスクと対策
kyohmizu
1
700
Amazon S3 Filesについて
yama3133
2
210
Featured
See All Featured
Designing for Performance
lara
611
70k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
520
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
110
Navigating Weather and Climate Data
rabernat
0
170
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
220
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
760
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
180
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
Building an army of robots
kneath
306
46k
Transcript
GPU NW BoF JANOG 55 (2025/1/24) Sho Shimizu, Preferred Networks,
Inc.
2 はじめに • GPU クラスタのネットワークは最近のホットトピックの1つ • 携わる機会が限られ、議論や情報交換をする場も少ない GPU クラスタに関わる人で議論や情報交換を行いたい
3 • Kernel bypass する GPU 間通信ではマルチテナンシーの課題がある ◦ NIC での何らかの機能サポートが不可欠
▪ VLAN Switch Tagging, Open vSwitch hardware offload, etc. LINEヤフーさんの NVIDIA AI Summit での発表 • マルチテナンシーを可能にする設計として Open vSwitch を使った構成 • 性能を追求するための Mellanox NIC による hardware offload GPU 間通信とマルチテナンシー
4 • GPUクラスタでのマルチテナンシー ◦ 検討している?していない? • 技術としての OVS hardware offload
◦ どのくらいの人が実際に使っているか ◦ どのような使い方をしているか ◦ 利用するときの注意点や課題 とっかかりのトピック