Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
さぁV100、メモリをお食べ・・・
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
nilpe
May 30, 2026
Programming
150
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
さぁV100、メモリをお食べ・・・
Persistent MemoryをGPUから使う方法
nilpe
May 30, 2026
Other Decks in Programming
See All in Programming
Agentic UI
manfredsteyer
PRO
0
180
Vite+ Unified Toolchain for the Web
naokihaba
0
330
エージェンティックRAGにAWSで入門しよう!
har1101
8
1.7k
代数的データ型って何が嬉しいの? #frontend_phpcon_do
kajitack
8
3.7k
Go1.27で導入されるジェネリクスメソッドでできること
mackee
0
160
ECSアプリログをFireLensでコスト削減しようとしたけど諦めた話 in Fargate×Node.js
akihisaikeda
2
4.2k
ユニットテストの先へ:テスト技法で要求・仕様を整理するJava開発実践 / Beyond_Unit_Testing_Practical_Java_Development_Techniques_for_Organizing_Requirements_and_Specifications
shimashima35
0
410
AIを活用したE2Eテスト実装効率化のあゆみ / ebisu-mobile-14-kotetu
kotetuco
0
120
例外の正しい扱い方 そのエラー try-catchして大丈夫?
jinwatanabe
0
270
Creating Composable Callables in Contemporary C++
rollbear
0
160
トークンをケチるな、設計しろ:GitHub Copilotを賢く使うコンテキスト戦略
ochtum
0
120
不変条件と整合性境界—ビジネスが決める設計判断と実現パターン / Invariants and Consistency Boundaries
nrslib
14
5.7k
Featured
See All Featured
Utilizing Notion as your number one productivity tool
mfonobong
4
320
Ethics towards AI in product and experience design
skipperchong
2
310
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Done Done
chrislema
186
16k
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
560
The World Runs on Bad Software
bkeepers
PRO
72
12k
Navigating Weather and Climate Data
rabernat
0
220
Joys of Absence: A Defence of Solitary Play
codingconduct
1
400
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
200
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
170
Transcript
さぁV100、メモリをお食べ・・・ KERNEL/VM探検隊@関西 12回目 NILPE(@NILPE_LV01)
自己紹介 nilpeと申します! バイクとカーネルと黒魔術が好きな 筑波大学 情報理工学位プログラム M1 初発表です ↑インターネットコミュ障のアカウント アイコンは実家の犬です
メモリが足りない! 最近、メモリが売られなくなりつつありますよね その他のパーツも高騰 of 高騰
「古い」GPUを有効活用したい 研究室に転がってるV100(PCIe)で遊びたい でもVRAMが32GB ””””ぽっち””””しかない VRAM外のメモリに退避したい! ↑画像はnvidia公式より
私の言う「メモリ」とは Intel Optane Persistent Memoryのこと(生産終了済み)
つかいかた ・Openして ・mmap()して ・cudaHostRegister()するだけ
おもむろに こういうコードを書く↓ best = 0 for size in 二分探索(2 MiB
... 探索上限): if cudaHostRegister(base, size) が成功: best = size cudaHostUnregister(base) 次はもっと大きい size を試す else: 次はもっと小さい size を試す Pmemの実装量とbest を表示する
実行すると あれぇ・・・? ↑DRAM実装量-4GBしか登録できてない
どうやら CUDAランタイムでホストDRAMの実装量を見ているらしい →LD_PRELOADでごまかす
やりなおす あれぇ・・・? ② ↑システムメモリ実装量分しか登録できてない(4GB増えた)
nVIDIAドライバを書き換える
512GBごとにRegisterする
結果
帯域幅
できた!!! ご清聴ありがとうございました Github→https://github.com/nilpe/pmem-gpu- devdax