Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
さぁV100、メモリをお食べ・・・
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
nilpe
May 30, 2026
Programming
100
0
Share
さぁV100、メモリをお食べ・・・
Persistent MemoryをGPUから使う方法
nilpe
May 30, 2026
Other Decks in Programming
See All in Programming
oxlintはeslint/typescript-eslintを置き換えられるのか
shomafujita
2
270
Sans tests, vos agents ne sont pas fiables
nabondance
0
160
Signal Forms: Beyond the Basics @ngBaguette 2026 in Paris
manfredsteyer
PRO
0
150
Swiftのレキシカルスコープ管理
kntkymt
0
200
net-httpのHTTP/2対応について
naruse
0
180
運用エージェントは "作る" から "育てる" へ - 記憶と自己進化の3層設計パターン / self-evolving-agents-three-layer-agent-design
gawa
12
3.2k
脅威をエンジニアリングの糧にして――現場編 / Turning Threats into Engineering Fuel — Field Edition
nrslib
0
210
tsserverとは何だったのか、これからどうなるのか
nowaki28
1
410
初めてのRubyKaigiはこう見えた
jellyfish700
0
180
AI駆動開発勉強会 広島支部 第一回勉強会 AI駆動開発概要とワークショップ
hayatoshimiu
0
400
ECR拡張スキャンでSBOMを収集して サプライチェーン攻撃の影響調査を 爆速で終わらせてみた
akihisaikeda
2
200
AI時代の仕事技芸論 — ソフトウェア開発で「遊ぶように働く」職人的熟達のすすめ
kuranuki
1
440
Featured
See All Featured
How Software Deployment tools have changed in the past 20 years
geshan
0
34k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
180
Git: the NoSQL Database
bkeepers
PRO
432
67k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1.1k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.2k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
HTML-Aware ERB: The Path to Reactive Rendering @ RubyCon 2026, Rimini, Italy
marcoroth
1
120
AI: The stuff that nobody shows you
jnunemaker
PRO
7
660
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.4k
BBQ
matthewcrist
89
10k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
750
How to build a perfect <img>
jonoalderson
1
5.5k
Transcript
さぁV100、メモリをお食べ・・・ KERNEL/VM探検隊@関西 12回目 NILPE(@NILPE_LV01)
自己紹介 nilpeと申します! バイクとカーネルと黒魔術が好きな 筑波大学 情報理工学位プログラム M1 初発表です ↑インターネットコミュ障のアカウント アイコンは実家の犬です
メモリが足りない! 最近、メモリが売られなくなりつつありますよね その他のパーツも高騰 of 高騰
「古い」GPUを有効活用したい 研究室に転がってるV100(PCIe)で遊びたい でもVRAMが32GB ””””ぽっち””””しかない VRAM外のメモリに退避したい! ↑画像はnvidia公式より
私の言う「メモリ」とは Intel Optane Persistent Memoryのこと(生産終了済み)
つかいかた ・Openして ・mmap()して ・cudaHostRegister()するだけ
おもむろに こういうコードを書く↓ best = 0 for size in 二分探索(2 MiB
... 探索上限): if cudaHostRegister(base, size) が成功: best = size cudaHostUnregister(base) 次はもっと大きい size を試す else: 次はもっと小さい size を試す Pmemの実装量とbest を表示する
実行すると あれぇ・・・? ↑DRAM実装量-4GBしか登録できてない
どうやら CUDAランタイムでホストDRAMの実装量を見ているらしい →LD_PRELOADでごまかす
やりなおす あれぇ・・・? ② ↑システムメモリ実装量分しか登録できてない(4GB増えた)
nVIDIAドライバを書き換える
512GBごとにRegisterする
結果
帯域幅
できた!!! ご清聴ありがとうございました Github→https://github.com/nilpe/pmem-gpu- devdax