Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
人間でもわかるLLVMバックエンド入門
Search
kazegusuri
March 30, 2013
Programming
20k
13
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
人間でもわかるLLVMバックエンド入門
kazegusuri
March 30, 2013
More Decks by kazegusuri
See All by kazegusuri
go-sqlite3を使ってCloud Spannerエミュレーターを作ってみた / Cloud Spanner emulator with go-sqlite3
kazegusuri
5
6.8k
handy-spanner GCPUG
kazegusuri
4
2.1k
Open SKT: メルペイ開発の裏側 / builderscon tokyo 2019 Open SKT
kazegusuri
22
28k
Keep watching and extending features of gRPC
kazegusuri
3
2.7k
Testing with microservices in merpay
kazegusuri
10
11k
Real World Mercari API Architecture
kazegusuri
1
6.4k
gRPC and REST with gRPC in practice
kazegusuri
19
8.1k
Fluentdで始めるPrometheus / Prometheus Tokyo Meetup #1
kazegusuri
1
2k
GRPCの実践と現状での利点欠点 / Go Conference 2016 Spring
kazegusuri
44
32k
Other Decks in Programming
See All in Programming
New "Type" system on PicoRuby
pocke
1
860
AutonomyとControlのあいだ:Graflowで記述するAIエージェント協調
myui
0
120
3Dシーンの圧縮
fadis
1
770
正しくソフトウェアを作る、前提を疑うための認知の視点 / doubt-premise
minodriven
21
6.6k
AI時代のUIはどこへ行く?その2!
yusukebe
21
7.1k
Mujeres en SEO Summit 2026 - Greatest Disaster Hits en Web Performance
guaca
0
170
ふつうのFeature Flag実践入門
irof
7
3.8k
エージェンティックRAGにAWSで入門しよう!
har1101
8
1.5k
運用エージェントは "作る" から "育てる" へ - 記憶と自己進化の3層設計パターン / self-evolving-agents-three-layer-agent-design
gawa
12
3.7k
PHPで使える日時の表現と、その知り方 #frontend_phpcon_do
o0h
PRO
0
230
Composerを使ったサプライチェーン攻撃の様子を眺めてみる #phpstudy
o0h
PRO
2
250
代数的データ型って何が嬉しいの? #frontend_phpcon_do
kajitack
8
3.6k
Featured
See All Featured
Fireside Chat
paigeccino
42
3.9k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
Context Engineering - Making Every Token Count
addyosmani
9
960
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
170
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
560
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
420
Java REST API Framework Comparison - PWX 2021
mraible
34
9.4k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
300
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
From π to Pie charts
rasagy
0
210
For a Future-Friendly Web
brad_frost
183
10k
Transcript
人間でもわかる LLVMバックエンド入門 風薬(@kazegusuri) x86/x64最適化勉強会#5
アジェンダ • 自己紹介 • 小ネタ • LLVMについて • LLVMバックエンド •
最適化のポイント
自己紹介 • 風薬(@kazegusuri) • サークル MotiPizzaで活動 – http://motipizza.com/ – LLVM本
– 冬はClang本(予定) • 仕事はWeb系の開発運用 – LLVMは全く関係無し • 勉強会での発表はこれが初めて
宣伝! • LLVM本出してます! – きつねさんでもわかるLLVM – 達人出版会様より販売 – http://tatsu-zine.com/books/llvm
小ネタ “LLVM BackenD”
小ネタ “LLVM BackenD” 0x4C 0x4C 0x56 0x4D 0x20 0x42 0x61
0x63 0x6B 0x65 0x6E 0x44 UTF8
小ネタ “LLVM BackenD” 0x4C 0x4C 0x56 0x4D 0x20 0x42 0x61
0x63 0x6B 0x65 0x6E 0x44 “0x4C 0x4C 0x56 0x4D 0x20 0x42 0x61 0x63 0x6B 0x65 0x6E 0x44” echo llvm-mc -disassembly | ⏎ UTF8
小ネタ “LLVM BackenD” 0x4C 0x4C 0x56 0x4D 0x20 0x42 0x61
0x63 0x6B 0x65 0x6E 0x44 “0x4C 0x4C 0x56 0x4D 0x20 0x42 0x61 0x63 0x6B 0x65 0x6E 0x44” echo llvm-mc -disassembly | ⏎ decl %esp decl %esp pushl %esi decl %ebp andb %al, 97(%edx) arpl %bp, 101(%ebx) outsb incl %esp UTF8 _人人人人人人人人人_ > 特に意味は無い <  ̄Y^Y^Y^Y^Y^Y^Y^Y ̄ こんなこともできます…
アジェンダ • 自己紹介 • 小ネタ • LLVMについて • LLVMバックエンド •
最適化のポイント
LLVMとは • コンパイラ基盤 – オプティマイザとコード生成 – 中間表現(LLVM IR)を入力とする • LLVMプロジェクトの1つ
– LLVM Core – 単にLLVMというとLLVM Coreを指すことが多い • サブプロジェクト – Clang, LLDB, compiler-rt, libc++, vmkit, polly…
なぜ注目されているのか • BSDライクの制限の緩いライセンス – GPLが使えない企業など – FreeBSDのデフォルトコンパイラ • モジュール化による再利用性 –
一部分にフォーカスできて再発明が不要 – ライブラリのように外からも叩ける – 実装がわかりやすい(GCCと比較して)
LLVMの流れ C/C++ Objective-C Haskell OCaml LLVM IR (中間表現) X86/X86-64 ARM
MIPS C/C++ JavaScript PTX/NVPTX
LLVMの流れ C/C++ Objective-C Haskell OCaml LLVM IR (中間表現) X86/X86-64 ARM
MIPS C/C++ JavaScript PTX/NVPTX フロントエンド ミドルエンド バックエンド
LLVMの流れ C/C++ Objective-C Haskell OCaml LLVM IR (中間表現) X86/X86-64 ARM
MIPS C/C++ JavaScript PTX/NVPTX フロントエンド ミドルエンド バックエンド アセンブリ オブジェクト生成
Passの概念 • LLVMでの処理は全てPassで行われる – 解析・最適化・コード生成 • 利用者は任意のPassを組み合わせて使う – llc などはそれらのデフォルトの組み合わせ
– opt で特定のPassを適用することもできる
Passの種類 • ImmutablePass • ModulePass • FunctionPass • LoopPass •
RegionPass • BasicBlockPass • MachineFunctionPass – バックエンド用Pass – 実際はFunctionPass ミドルエンド用
アジェンダ • 自己紹介 • 小ネタ • LLVMについて • LLVMバックエンド •
最適化のポイント
バックエンドの流れ • LLVM IRを入力として何度か形式を変える – 形式の変更のことをLoweringと呼ぶ – 処理はMachineFunctionPassで行われる LLVM IR
SelectionDAG MachineCode MC Layer Assembly Object SelectionDAGISel MachineFunctionPass AsmPrinter
SelectionDAGISelパス • LLVM IRをDAG(有向非巡回グラフ)に変換 • ノードの置き換えや共通部分削除など • 最終的にMachineCodeを生成 LLVM IR
SelectionDAG MachineCode MC Layer Assembly Object
SelectionDAGISelパス • Lowering – LLVM IRからSDNode(illegal)への変換 • Combine – パターンマッチによる最適化
• Legalize – SDNode(illegal)からSDNode(legal) • Select – SDNodeからMachineCodeへの変換 • Schedule – 命令のスケジューリング LLVM IR SelectionDAG MachineCode MC Layer Assembly Object
MachineCode • より機械語に近い形式 – LLVM IRは機械語と比較すると抽象度が高い – 実際の命令や物理レジスタを持つ • フェーズによって形式が変わる
– 仮想レジスタ、PHIノード有、SSA形式 – 物理レジスタ、PHIノード無、Non-SSA形式 • 構造はLLVM IRと似ている – BasicBlock, Function, Instruction, Operand LLVM IR SelectionDAG MachineCode MC Layer Assembly Object
MachineSSAOptimization • SSA形式でのターゲット依存の最適化 – Stack Slot Coloring – Local Stack
Slot Allocation – Peephole Optimization – 他にも… LLVM IR SelectionDAG MachineCode MC Layer Assembly Object
Non-SSA形式でのパス • Eliminate PHI nodes – Φノードをここでやっと削除 – Non-SSA形式になる •
Register Allocation – 仮想レジスタから物理レジスタに • Prologue/Epilogue Insertion – 関数呼び出しに関するターゲット依存の処理 LLVM IR SelectionDAG MachineCode MC Layer Assembly Object
AsmPrinterパス • コード生成 – アセンブリもオブジェクトも共通処理 • MC Layerで抽象化されている • AsmPrinterの役割
– MachineCodeからMCInstへのLowering – MC Layerの操作 LLVM IR SelectionDAG MachineCode MC Layer Assembly Object
MC Layer(MCInst) • コード生成などを抽象化するレイヤ – アセンブリ, オブジェクト, JIT – 処理が共通化
• MCInst – MC Layerで扱う命令形式 – 関数などの構造が無くフラット LLVM IR SelectionDAG MachineCode MC Layer Assembly Object
MC Layer Assembly (.s) Code (.c) Object (.o) MCStreamer MCInst
Disassembler Assembly (.s) Object (.o) Execution Code Generator Assembly Parser Assembly Printer Object Writer MCJIT Assembly (.s) Assembly Printer MC Layer LLVM IR SelectionDAG MachineCode MC Layer Assembly Object
コード生成後 • 各種ツールもある – llvm-objdump ( .o => .s) –
clang (.o => a.out) • リンカ代わり – llvm-linker (.ll => .ll) – llc (.ll => .s or .o) LLVM IR SelectionDAG MachineCode MC Layer Assembly Object
アジェンダ • 自己紹介 • 小ネタ • LLVMについて • LLVMバックエンド •
最適化のポイント
最適化のポイント • 最適化可能な場所が多い – 粒度が異なる – どこでやるか? • フロントエンド •
ミドルエンド • バックエンド
最適化のポイント • フロントエンド – LLVM IRに落とすところも重要 – 元のソースコードの意味を活かせる • ミドルエンド
– 多くの情報を失っているがまだ大幅な最適化が できる • メタデータで情報を残すこともできる – 自動並列化(祖粒度,細粒度)
バックエンドでの最適化 • 機械命令レベルの最適化 – 1命令を減らす最適化はバックエンドでのみ • LLVM IRと同じ意味になる命令へ置き換え – パターンマッチによる置き換え(SelectionDAG)
– 大規模な最適化はできない(?) • 関数を超えた最適化はできないかも • 置き換え以上のことをやるなら独自Pass – 好きなタイミングでPass実行もできる • SSA or Non-SSA – 自分はやったことないですが…
LLVMとの戦いはまだまだ続く… fin.