Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ACRiルームにAMD GPUを入れた話
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Jun Ando
July 13, 2024
Technology
920
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ACRiルームにAMD GPUを入れた話
fpgax #14
Jun Ando
July 13, 2024
More Decks by Jun Ando
See All by Jun Ando
Ryzen NPUにおけるAI Engineプログラミング
anjn
0
550
ACRiルーム最新情報とAMD GPUサーバーのご紹介
anjn
0
380
AI Engine に適したCNN アーキテクチャの検討と実装
anjn
0
84
Other Decks in Technology
See All in Technology
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
110
小さくはじめるSLI/SLO ~育てながら組織に定着させる実践知~ / Starting Small with SLI/SLOs: Building Adoption Through Continuous Growth
nari_ex
2
1.3k
2026 TECHFRESH 畢業分享會 - 開發日常大解密!從領域驅動到企業級上線
line_developers_tw
PRO
0
670
2026TECHFRESH畢業分享會 - 葬送的通靈師:化系統與用戶雜訊成行動訊號
line_developers_tw
PRO
0
670
日本 Fintech 未来予測レポート 2027〜2028年(手動編集版)
8maki
0
1.3k
Reliability in the Age of AI: Engineering for AI Velocity
rrreeeyyy
0
120
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
680
失敗を資産に変えるClaude Code
shinyasaita
0
290
脆弱性対応、どこで線を引くか
rymiyamoto
0
350
NAB Show 2026 動画技術関連レポート / NAB Show 2026 Report
cyberagentdevelopers
PRO
0
160
Bucharest Tech Week 2026 - Reinventing testing practices in the AI era
edeandrea
PRO
1
130
社内 AI エージェント Synapse と セマンティックレイヤーの育て方
hiroakis
2
1.6k
Featured
See All Featured
WCS-LA-2024
lcolladotor
0
620
Abbi's Birthday
coloredviolet
2
8k
Faster Mobile Websites
deanohume
310
31k
Site-Speed That Sticks
csswizardry
13
1.2k
Code Reviewing Like a Champion
maltzj
528
40k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
160
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.5k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
160
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
280
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
Transcript
ACRiルームにAMD GPUを入れた話 ACRiルーム副室長/AMD 安藤 ©︎ 2024 Adaptive Computing Research Initiative
- ACRi 1 fpgax #14 LT
fpgax #14 ACRi ルーム ©︎ 2024 Adaptive Computing Research Initiative
- ACRi 2 Alveo / VCK5000 Professors ACRi Founders • Digilent社 Arty A7-35T カード • 1サーバにArtyを15枚接続 • ユーザ毎にVMを割り当て ルーム FPGA Server • CPU: Core i9 (8 core /16 thread) • メモリ: DDR4 128GB (32GB x 4) • ストレージ: SSD M.2 1TB x2 • 開発環境インストール済み Arty A7-35T • 3時間単位で機材を無償で貸出し • リモートからアクセスして利用するスタイル • Forumを通じて大学教員やACRi企業が技術支援を実施 • Xilinxアクセラレータカード • Alveo U50 / U200 / U250 / U280 / VCK5000 Alveo Arty ACRi 参加企業 一般企業 学生 若手技術者 Start-up企業 技術力向上 テスト利用 技術力向上 のため 技術力向上 テスト利用 Instinct • AMD Instinct GPU • MI210 64GB
fpgax #14 AMD Instinct MI210 • スペック概要 ©︎ 2024 Adaptive
Computing Research Initiative - ACRi 3 大容量のVRAMを積んでいるので 生成AIで遊ぶのに良さそう! ACRiルームでMI210が使えるようになる までの話をします
fpgax #14 インストールの準備(冷却) • MI210はファン無しなので冷却ファンを作る • ACRiルームにラックサーバーはありません ©︎ 2024 Adaptive
Computing Research Initiative - ACRi 4 1. ファンを取り付けるアダプタを印刷 2. ちょうど良いねじ穴にねじ止め 3. ファンを装着
fpgax #14 インストールの準備(電源) • MI210の補助電源はATX12V( EPS12V ) • PCIe補助電源を無理に挿すと壊れます •
マザーボード向けを1本 MI210に ©︎ 2024 Adaptive Computing Research Initiative - ACRi 5 マザーボード 電源ユニット ATX12V ATX12V MI210 PCIe補助電源コネクタに見えるが 微妙にピンの形が違う
fpgax #14 インストールの準備が完了 ©︎ 2024 Adaptive Computing Research Initiative -
ACRi 6 自宅での検証の様子。PCケースが小さくて入らなかった
fpgax #14 ACRiルームの仕組み(Alveo系サーバーの場合) ©︎ 2024 Adaptive Computing Research Initiative -
ACRi 7 aservX(物理ホスト) CPU:16 threads Mem:128GB as00X(コンテナ) CPU:8 threads Mem:64GB ファイル サーバー ファイル サーバー /dev/xclmgmt* /dev/dri/renderD* /dev/xfpga/* /dev/xvc_* /scratch /opt/xilinx/platforms /home/$USER /tools NFS NFS Local SSD ssh xrdp 認証 予約 サーバー ログイン サーバー 認証 サーバー Alveo start_container.sh cron 毎分実行 起動/停止/削除 参照 マウント NIS ユーザー
fpgax #14 利用環境内でDockerが使える仕組み • 従来の利用環境はDockerで構築 • Docker内でDockerを動かせるようにするには特権モードが必要 • Rootless Docker
in LXD • LXDはシステムコンテナ • コンテナ内でsystemdが動き、仮想マシンのように使える • Ansibleでコンテナ内にデスクトップ環境を構築 • Rootless Dockerはユーザー権限で実行するDocker • ユーザーが自由にコンテナを使用できる ©︎ 2024 Adaptive Computing Research Initiative - ACRi 8 ホスト LXD Rootless Docker Vitis AI等 PCIeデバイス 利用環境
fpgax #14 利用環境内でDockerが使える仕組み • LXDのidmap設定で一般ユーザーのUID/GIDを一致 • ホストにマウントされたNFSに利用環境からアクセスできる • Rootless Dockerコンテナ内の一般ユーザーには未使用のUID/GIDを割り当てる
©︎ 2024 Adaptive Computing Research Initiative - ACRi 9 ホスト LXD Rootless Docker Vitis AI等 利用環境 root root ??? user-a user-a user-b user-b root UID idmap user-c ??? ??? /etc/subuid /etc/subgid ??? ??? group-d GID
fpgax #14 コンテナ内でAMD GPUを利用する • ROCm • 一般ユーザーが使うにはvideo/renderグループに属している必要あり • ホストのGIDをRootless
Dockerコンテナまでつなげる ©︎ 2024 Adaptive Computing Research Initiative - ACRi 10 ホスト LXD Rootless Docker Vitis AI等 利用環境 root root ??? user-a user-a user-b user-b root UID idmap user-c ??? ??? /etc/subuid /etc/subgid ??? ??? group-d video video video render render render GID idmap
fpgax #14 生成AIを動かしてみる • ROCm Blogs • 週1以上のペースでAIを中心としたGPU活用の記事を配信 • vLLMを動かす記事を試してみた
• Rootless Dockerを使ってvLLMのDockerイメージの作成、動作に成功 ©︎ 2024 Adaptive Computing Research Initiative - ACRi 11 https://rocm.blogs.amd.com/artificial-intelligence/openllm/README.html
fpgax #14 生成AIを動かしてみる • CyberAgentLM3-22B-Chat • 7/9プレスリリース • 22Bパラメータ(45GB) •
MI210なら量子化なしでOK • vLLMで16リクエストを同時処理 • 計約160 tokens/sec ©︎ 2024 Adaptive Computing Research Initiative - ACRi 12 FPGAのエクストリームな使い方を聞いてみています
fpgax #14 チュートリアル作りました • AIモデルをMI210で学習、VCK5000で推論 • https://gw.acri.c.titech.ac.jp/wp/manual/vitis-ai-rocm ©︎ 2024 Adaptive
Computing Research Initiative - ACRi 13 PyTorch Lightningで学習 Vitis AIコンテナで量子化、コンパイル AI Engineで推論
fpgax #14 まとめ • ACRiルームにMI210が入りました • それなりに大きなモデルも動きます • 遊んでみてください ©︎
2024 Adaptive Computing Research Initiative - ACRi 14
fpgax #14 ©︎ 2024 Adaptive Computing Research Initiative - ACRi
15
fpgax #14 ACRi 参加団体(2024年6月) ©︎ 2024 Adaptive Computing Research Initiative
- ACRi 16