Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ソースコードから理解するPreloadとJITの話/preload_and_jit
Search
Ryo Tomidokoro
December 12, 2020
Programming
1
2.8k
ソースコードから理解するPreloadとJITの話/preload_and_jit
preloadとJITの話をなるべくわかり易く、それでいて深く書いてみました。
Ryo Tomidokoro
December 12, 2020
Tweet
Share
More Decks by Ryo Tomidokoro
See All by Ryo Tomidokoro
集中して作業する技術/how_to_work_deeply
hanhan1978
61
40k
PHPでデータベースを作ってみた/create-data-with-php
hanhan1978
10
9.1k
ADRを一年運用してみた/adr_after_a_year
hanhan1978
8
3.4k
B+木入門:PHPで理解する データベースインデックスの仕組み/b-plus-tree-101
hanhan1978
5
4.5k
ADRを一年運用してみた/our_story_about_adr
hanhan1978
5
2k
PHPで学ぶ Session の基本と応用 / web-app-session-101-2024
hanhan1978
12
5.5k
レガシー回避のPHP開発術/avoid_php_legacy
hanhan1978
16
12k
Laravel Collectionの計算量を調べてみた2023/laravel_collection_time_complexity_2023
hanhan1978
1
1.4k
PHP で学ぶ Cache の距離の話 / study_cache_with_php
hanhan1978
7
2.1k
Other Decks in Programming
See All in Programming
RubyLSPのマルチバイト文字対応
notfounds
0
120
TypeScript Graph でコードレビューの心理的障壁を乗り越える
ysk8hori
2
1.1k
リアーキテクチャxDDD 1年間の取り組みと進化
hsawaji
1
220
Make Impossible States Impossibleを 意識してReactのPropsを設計しよう
ikumatadokoro
0
170
Jakarta Concurrencyによる並行処理プログラミングの始め方 (JJUG CCC 2024 Fall)
tnagao7
1
290
Click-free releases & the making of a CLI app
oheyadam
2
110
Ethereum_.pdf
nekomatu
0
460
LLM生成文章の精度評価自動化とプロンプトチューニングの効率化について
layerx
PRO
2
190
Realtime API 入門
riofujimon
0
150
Creating a Free Video Ad Network on the Edge
mizoguchicoji
0
110
どうして僕の作ったクラスが手続き型と言われなきゃいけないんですか
akikogoto
1
120
Nurturing OpenJDK distribution: Eclipse Temurin Success History and plan
ivargrimstad
0
870
Featured
See All Featured
A designer walks into a library…
pauljervisheath
203
24k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
25
1.8k
4 Signs Your Business is Dying
shpigford
180
21k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
665
120k
Designing the Hi-DPI Web
ddemaree
280
34k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
A Tale of Four Properties
chriscoyier
156
23k
Code Reviewing Like a Champion
maltzj
520
39k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
4
370
Become a Pro
speakerdeck
PRO
25
5k
A Philosophy of Restraint
colly
203
16k
Adopting Sorbet at Scale
ufuk
73
9.1k
Transcript
@hanhan1978 ソースコードから理解する PreloadとJITの話 PHP Conference Japan 2020/12/12
@hanhan1978 • 富所 亮 • 職業 ◦ Webアプリケーションエンジニア ◦ 雑用係
• ブログ ◦ https://blog.hanhans.net • Yokohama North AM ◦ https://anchor.fm/yokohama-north-am
興味のある方は... ※気が向いた時にやってます ... https://shadow-php.connpass.com/
秒でGDBデバッグ https://github.com/hanhan1978/shadow-php/wiki
本日のテーマ preloadとjitの肌感を掴む • 謎の技術にせず、仕組みから理解 • どれくらい速度向上するのか • 本番環境での採用是非
PHP高速化の歴史
PHPはスクリプト言語 実行の大まかな流れ
PHPはスクリプト言語 実行の大まかな流れ ここで時間がかかる
PHPerが行ってきた解決策
中間コードキャッシュ コンパイル結果(OPCode)をメモリにキャッシュ
歴代の中間コードキャッシュ XCache 〜PHP5.6 eAccelarator 〜PHP5.6 Alternative PHP Cache (APC) PHP5.4
Zend Opcache PHP5.5〜 ※これらのツールを同居させると ShareMemory戦国時代になりSegFault
OPCacheがデファクトスタンダード PHP5.5以降は一択 そして、PHP7.4以降からOPCacheにさらなる高速化の仕組みが 導入されるようになった....ここから本題
余談1 稀によく見るうっかりさん。OPCache入ってない ※php -v ですぐ確認できるので、心当たりのある方は確認を
※OPcacheが入ってなくて良いことは一個もないです
PHPスクリプト実行の詳細
PHPはスクリプト言語 • 実行時にコンパイル • コンパイル&実行を繰返す
例えば
PHP実行の流れ
None
実行の詳細
None
None
中間コードキャッシュに よってコンパイルの過程 が省略される
具体例
ファイル構成
index.php
autoload.php
A.php
B.php
実行すると
実行すると autoloaderが2回呼び出されている
実行の流れ
4回のコンパイル
OPCacheが解決するもの 4回分のコンパイルがキャッシュで解決
計測
OPCache − ◯ Req / Sec 111.55 680.42 ※OPCacheの有効化によって、処理速度は約 6倍
Laravelの30秒ベンチマーク
高速化技術が達成すること 1. OPCache >> 2. OPCache preload >> 3. OPCache
JIT >> ??? ??? ???
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> 3.
OPCache JIT >> ??? ???
OPCache preloadとは?
PHP7.4から追加 https://wiki.php.net/rfc/preload
• OPCacheの機能追加として提案 • サーバー起動時に指定ファイルをコンパイル して、メモリに読込 ※一見すると、中間コードキャッシュと同じことをしているように見える
具体例
ファイル構成
preload.php
php.ini
実行すると
実行すると Class Aはautoloadされてない!!
実行の流れ
3回のコンパイル
• autoloadが省略される • preload以外のファイルは opcache.validate_timestamp=0と同じ挙動 • 直接のrequireはpreloadが活用されない
preloadソース v7.4.3
ext/opcache/ZendAccelarator.c - SAPI起動時に L4200 preload_load() - globalなデータ領域にpreloadしたクラス、ファイルの情報を登録 する - opcodes実行時のコンパイルに使われるのは、L1914
persistent_compile_file。これはpreloadの有無に依らない
Zend/zend_execute_API.c - L1419 zend_fetch_class_by_name が未解決のクラス名に対して コールされる - zend_hash_findでコンパイル済みのクラスが発見されれば、それを 使う(preload) -
それ以外は、autoloaderを使ってクラスの解決が行われて、ファイル が見つかればコンパイルされる ※要するにpreloadされるとautoloaderまで処理がいかずに解決できる
計測
Laravelの30秒ベンチマーク OPCache − ◯ ◯ Preload − − ◯ Req
/ Sec 111.55 680.42 774.14 ※preload有効化によって、処理速度は約 14%向上
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> 3.
OPCache JIT >> ??? ???
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> ???
余談 Windows用PHPのpreload機能は7.4.2の時点で機能削除 https://www.php.net/manual/en/opcache.preloading.php
OPCache JITとは?
PHP8.0から追加 https://wiki.php.net/rfc/jit
ZendVMで実行するのではなく Native Codeを実行する
• 機械語実行により処理速度が最適化 • 同様のことはpcre-jitやJS等でもおなじみ
実行の詳細
None
None
OPCodeをさらに機械語に変換 CPUで直接実行!!
• コード実行が最適化 • JITコンパイルのオーバーヘッドは実行速度で 補填
JITソース v8.0.0
OPCacheが主に関わってくるソースコード JIT関連はopcache/jitに固まっているので 分かりやすい。
opcodeをx86のアセンブラに変換している zend_jit_x86.c
ext/opcache/jit/zend_jit.c - zend_jit_op_array において泥臭い変換処理が行われている - アーキテクチャ依存のコード変換なので未対応だと動作しない - LuaJIT由来のDynAsmを利用
JIT化される単位 - zend_jit_op_array はファイル毎に呼び出し - クラス単位、関数単位でopcodeの最適化が行われて、関数のIOを合わ せた形でZendVMの主処理と繋ぎ合わされる - 1ファイル1関数に全部の処理を入れたら、効果的に効きそう
計測
Laravelの30秒ベンチマーク OPCache − ◯ ◯ Preload − − ◯ Req
/ Sec 111.55 680.42 774.14 Req / Sec (JIT) − 696.57 812.93 ※JIT有効化によって、処理速度は約 2.5〜5%向上
モンテカルロ法を計測
円周率計算のベンチマーク OPCache − ◯ Sec 9.74 8.96 Sec (JIT) −
5.20 ※JIT有効化によって、処理速度は約 42%向上 100,000,000回試行の処理時間
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> ???
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> コード実行の最適化
JITの現状
• https://bugs.php.net/search.php?cmd=display&packa ge_name[]=opcache • RedditのPHP系板 • https://www2.slideshare.net/nikita_ppv/justintime-co mpiler-in-php-8 情報キャッチアップ
使用上の注意
• 内部の実行パスが変わる • 開発も同じ設定にするのが吉 • ファイル更新でopcache_clearとか...
phpunitで使うには これを設定しないと、コマンドライン実行時にopcache が動かない。
まとめ
高速化技術が解決すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> コード実行の最適化
仕組みを理解 適切なアプリケーションに適用 コレ大事!!
参考1 https://speakerdeck.com/hanhan1978/web-application-tuning-guildline
参考2 https://gist.github.com/hellerbarde/2843375 Network IOはメモリアク セスの5万倍遅い
リアルなウェブアプリのボトルネックは、大半 がDBアクセス CPU負荷の数%は全体のボトルネックでは 微々たるもの
本番投入はオススメしづらい... ISUCON用機能なのでは...