Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「プログラマーのためのCPU入門」は入り口として丁度よい!
Search
forrep
February 28, 2024
Programming
45
30k
「プログラマーのためのCPU入門」は入り口として丁度よい!
forrep
February 28, 2024
Tweet
Share
More Decks by forrep
See All by forrep
RAGにベクトルDBは必要ない!DBも不要で運用めちゃ楽な RAG Chatbot を作った話
forrep
35
14k
Google Analytics でサイト速度を計測する / Measure site speed with Google Analytics
forrep
2
250
最近コードレビューで指摘したこと
forrep
3
340
DevTools でパフォーマンスチューニング入門 / Introduction to Performance Tuning with DevTools
forrep
2
320
技術的負債に対する視力を得る / How to View Technical Debt
forrep
0
560
しくじり先生 - NFS+sqliteで苦労した話から学ぶ、問題解決の考え方 / problem-solving approach
forrep
1
1k
理屈で考える、データベースのチューニング / Database tuning How-To
forrep
28
8.7k
ブラウザの制約条件から考えるフロントエンドのリソース設計/Frontend Performance How to
forrep
2
710
Other Decks in Programming
See All in Programming
watsonx.ai Dojo #6 継続的なAIアプリ開発と展開
oniak3ibm
PRO
0
170
為你自己學 Python
eddie
0
520
QA環境で誰でも自由自在に現在時刻を操って検証できるようにした話
kalibora
1
140
ISUCON14感想戦で85万点まで頑張ってみた
ponyo877
1
590
PHPで作るWebSocketサーバー ~リアクティブなアプリケーションを知るために~ / WebSocket Server in PHP - To know reactive applications
seike460
PRO
2
770
PicoRubyと暮らす、シェアハウスハック
ryosk7
0
200
chibiccをCILに移植した結果 (NGK2025S版)
kekyo
PRO
0
120
Alba: Why, How and What's So Interesting
okuramasafumi
0
200
BEエンジニアがFEの業務をできるようになるまでにやったこと
yoshida_ryushin
0
190
Итераторы в Go 1.23: зачем они нужны, как использовать, и насколько они быстрые?
lamodatech
0
1.3k
Swiftコンパイラ超入門+async関数の仕組み
shiz
0
170
はてなにおけるfujiwara-wareの活用やecspressoのCI/CD構成 / Fujiwara Tech Conference 2025
cohalz
2
2.7k
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
Raft: Consensus for Rubyists
vanstee
137
6.7k
Visualization
eitanlees
146
15k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
6
500
Rebuilding a faster, lazier Slack
samanthasiow
79
8.8k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
2k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
960
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.6k
Transcript
「プログラマーのためのCPU入門」 は入り口として丁度よい! ~ Webエンジニア目線 ~ 1 株式会社ラクーンホールディングス 技術戦略部 羽山純
自己紹介 • 名前 ◦ 羽山 純(Jun Hayama) • 所属 ◦
株式会社ラクーンホールディングス 技術戦略部 • 技術領域 ◦ バックエンド・インフラ ◦ パフォーマンス改善 ▪ MySQLでプライマリキーをUUIDにする前に知っておいて欲しいこと ◦ AI(企業審査AI) • 個人活動 ◦ アプリ開発 2
紹介する書籍 プログラマーのためのCPU入門 - CPUは如何にしてソフトウェアを 高速に実行するか いわゆる「低レイヤ」の書籍です 3 Takenobu Tani.(2023-1-25).“プログラマーのためのCPU入門 -
CPUは如何にしてソフトウェアを高速に実行するか”.ラムダ ノート.https://www.lambdanote.com/products/cpu
「低レイヤ」について、こう思っていませんか? • WebエンジニアにはCPUほどの低レイヤは必要ない • クラウド環境だから細かいことを考えなくてもよい • 現代のCPUは十分に速いから気にしなくてもよい → そんなことはありません 4
本書で得られるメリット(1) 本書で得られるメリット(1) カーネルの理解を深められる 5
カーネルの知識を深められる 上位レイヤは下位レイヤに依存し、 各レイヤの習得には1~2レイヤ下までの知識が必要です 本書はCPUへの理解を通して カーネルの理解を深めてくれます 6 アプリケーション ライブラリ・FW ランタイム・VM コンパイラ
ユーザー空間 カーネル ハードウェア OS CPU 他 言語 依存 依存 依存 依存 依存
本書で得られるメリット(2) 本書で得られるメリット(2) 長く生きる汎用的な知識と問題解決力 7
山で遭難したら登れ 「山で遭難したら登れ」と言われます 逆すり鉢の形状で山頂に近づくほど狭くなるため 登ると正規ルートに復帰できる可能性が 高くなります この形は先ほどの「低レイヤ」の図 と似てませんか? 8
低レイヤほどバリエーションが減少 アプリケーションは要件やサービスだけ星の数ほど ライブラリ・FW は Django, Flask, SpringBoot, Rails, , ,
その下層は Python, Java, Ruby, , , OS は Linux がデファクト 低レイヤほどバリエーションが少なく 長く使える汎用的な知識となります 9 アプリケーション ライブラリ・FW ランタイム・VM コンパイラ ユーザー空間 カーネル ハードウェア OS CPU 他 言語
問題解決力 問題解決では、順に低レイヤに降りると解決しやすいです いずこかで発生した問題に対し、 降りられる限界のレイヤが そのエンジニアの力量です 本書でCPUの知識を通して カーネルへの理解を深めると 問題解決力が上昇します 10 アプリケーション
ライブラリ・FW ランタイム・VM コンパイラ ユーザー空間 カーネル ハードウェア OS CPU 他 言語
本書で得られるメリット(3) 本書で得られるメリット(3) パフォーマンスはやっぱり大切 11
アプリ・インフラの高速化のヒントがたくさん • システムコールが遅い理由を仕組みから理解できた • メモリは仮想記憶のため1度の取得に2回のアクセスが必要 ◦ 仮想アドレスと物理アドレスをページテーブルで変換 ◦ ページテーブルのキャッシュ(TLB)をミスするととても遅い ◦
巨大なメモリ空間を利用するとページテーブルが肥大化する • メモリはCPUより4倍ほど遅いが、L1キャッシュミスすると 100倍ほどまで遅くなる、メインメモリはとても遅い ◦ 小さいメモリ空間の利用は速いが、巨大なメモリ空間をランダ ムで使うと、キャッシュミスして100~1000倍は遅い • 複数コア・マルチスレッドで同一アドレスへの書き込みを行 うと「コヒーレンスミス」が発生して非常に遅い ◦ マルチプロセスモデルの方が優れているシーンもある 12
まとめと余談 Webエンジニア目線で本書は CPUを通してカーネルの知識を深めるために有用です そして、効率的なアルゴリズムを組むのに最適な知識が たくさん詰まっています パズルの最適解を探すアプリを開発していた時代に 出会っていたら、あと2割は演算を速くできたと思います 13