Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ソースコードから理解するPreloadとJITの話/preload_and_jit
Search
Ryo Tomidokoro
December 12, 2020
Programming
2
3.1k
ソースコードから理解するPreloadとJITの話/preload_and_jit
preloadとJITの話をなるべくわかり易く、それでいて深く書いてみました。
Ryo Tomidokoro
December 12, 2020
Tweet
Share
More Decks by Ryo Tomidokoro
See All by Ryo Tomidokoro
どうすると生き残れないのか/how-not-to-survive
hanhan1978
17
13k
100分で本番デプロイ!Laravelで作るWebアプリケーション作成/100min_web_app_cicd
hanhan1978
1
110
PHPerのための計算量入門/Complexity101 for PHPer
hanhan1978
6
2.4k
集中して作業する技術/how_to_work_deeply
hanhan1978
62
48k
PHPでデータベースを作ってみた/create-data-with-php
hanhan1978
11
10k
ADRを一年運用してみた/adr_after_a_year
hanhan1978
8
3.9k
B+木入門:PHPで理解する データベースインデックスの仕組み/b-plus-tree-101
hanhan1978
5
5.1k
ADRを一年運用してみた/our_story_about_adr
hanhan1978
5
2.2k
PHPで学ぶ Session の基本と応用 / web-app-session-101-2024
hanhan1978
13
5.9k
Other Decks in Programming
See All in Programming
一緒に働きたくなるプログラマの思想 #QiitaConference
mu_zaru
81
21k
インプロセスQAにおいて大事にしていること / In-process QA Meetup
medley
0
170
2025-04-25 GitHub Copilot Agent ライブデモ(スクリプト)
goataka
0
110
Cursorを活用したAIプログラミングについて 入門
rect
0
220
Road to Ruby for A Linguistics Nerd
hayat01sh1da
PRO
0
300
파급효과: From AI to Android Development
l2hyunwoo
0
160
MySQL初心者が311個のカラムにNot NULL制約を追加していってALTER TABLEについて学んだ話
hatsu38
2
140
OpenTelemetry + LLM = OpenLLMetry!?
yunosukey
1
130
2025年のz-index設計を考える
tak_dcxi
12
4.5k
Cursor/Devin全社導入の理想と現実
saitoryc
29
22k
Global Azure 2025 @ Kansai / Hyperlight
kosmosebi
0
150
Cloudflare Workersで進めるリモートMCP活用
syumai
5
610
Featured
See All Featured
StorybookのUI Testing Handbookを読んだ
zakiyama
30
5.7k
Navigating Team Friction
lara
185
15k
Why You Should Never Use an ORM
jnunemaker
PRO
56
9.4k
Designing Experiences People Love
moore
142
24k
Mobile First: as difficult as doing things right
swwweet
223
9.6k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.4k
Site-Speed That Sticks
csswizardry
6
540
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
21k
Bash Introduction
62gerente
613
210k
The Cost Of JavaScript in 2023
addyosmani
49
7.8k
Statistics for Hackers
jakevdp
799
220k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.5k
Transcript
@hanhan1978 ソースコードから理解する PreloadとJITの話 PHP Conference Japan 2020/12/12
@hanhan1978 • 富所 亮 • 職業 ◦ Webアプリケーションエンジニア ◦ 雑用係
• ブログ ◦ https://blog.hanhans.net • Yokohama North AM ◦ https://anchor.fm/yokohama-north-am
興味のある方は... ※気が向いた時にやってます ... https://shadow-php.connpass.com/
秒でGDBデバッグ https://github.com/hanhan1978/shadow-php/wiki
本日のテーマ preloadとjitの肌感を掴む • 謎の技術にせず、仕組みから理解 • どれくらい速度向上するのか • 本番環境での採用是非
PHP高速化の歴史
PHPはスクリプト言語 実行の大まかな流れ
PHPはスクリプト言語 実行の大まかな流れ ここで時間がかかる
PHPerが行ってきた解決策
中間コードキャッシュ コンパイル結果(OPCode)をメモリにキャッシュ
歴代の中間コードキャッシュ XCache 〜PHP5.6 eAccelarator 〜PHP5.6 Alternative PHP Cache (APC) PHP5.4
Zend Opcache PHP5.5〜 ※これらのツールを同居させると ShareMemory戦国時代になりSegFault
OPCacheがデファクトスタンダード PHP5.5以降は一択 そして、PHP7.4以降からOPCacheにさらなる高速化の仕組みが 導入されるようになった....ここから本題
余談1 稀によく見るうっかりさん。OPCache入ってない ※php -v ですぐ確認できるので、心当たりのある方は確認を
※OPcacheが入ってなくて良いことは一個もないです
PHPスクリプト実行の詳細
PHPはスクリプト言語 • 実行時にコンパイル • コンパイル&実行を繰返す
例えば
PHP実行の流れ
None
実行の詳細
None
None
中間コードキャッシュに よってコンパイルの過程 が省略される
具体例
ファイル構成
index.php
autoload.php
A.php
B.php
実行すると
実行すると autoloaderが2回呼び出されている
実行の流れ
4回のコンパイル
OPCacheが解決するもの 4回分のコンパイルがキャッシュで解決
計測
OPCache − ◯ Req / Sec 111.55 680.42 ※OPCacheの有効化によって、処理速度は約 6倍
Laravelの30秒ベンチマーク
高速化技術が達成すること 1. OPCache >> 2. OPCache preload >> 3. OPCache
JIT >> ??? ??? ???
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> 3.
OPCache JIT >> ??? ???
OPCache preloadとは?
PHP7.4から追加 https://wiki.php.net/rfc/preload
• OPCacheの機能追加として提案 • サーバー起動時に指定ファイルをコンパイル して、メモリに読込 ※一見すると、中間コードキャッシュと同じことをしているように見える
具体例
ファイル構成
preload.php
php.ini
実行すると
実行すると Class Aはautoloadされてない!!
実行の流れ
3回のコンパイル
• autoloadが省略される • preload以外のファイルは opcache.validate_timestamp=0と同じ挙動 • 直接のrequireはpreloadが活用されない
preloadソース v7.4.3
ext/opcache/ZendAccelarator.c - SAPI起動時に L4200 preload_load() - globalなデータ領域にpreloadしたクラス、ファイルの情報を登録 する - opcodes実行時のコンパイルに使われるのは、L1914
persistent_compile_file。これはpreloadの有無に依らない
Zend/zend_execute_API.c - L1419 zend_fetch_class_by_name が未解決のクラス名に対して コールされる - zend_hash_findでコンパイル済みのクラスが発見されれば、それを 使う(preload) -
それ以外は、autoloaderを使ってクラスの解決が行われて、ファイル が見つかればコンパイルされる ※要するにpreloadされるとautoloaderまで処理がいかずに解決できる
計測
Laravelの30秒ベンチマーク OPCache − ◯ ◯ Preload − − ◯ Req
/ Sec 111.55 680.42 774.14 ※preload有効化によって、処理速度は約 14%向上
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> 3.
OPCache JIT >> ??? ???
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> ???
余談 Windows用PHPのpreload機能は7.4.2の時点で機能削除 https://www.php.net/manual/en/opcache.preloading.php
OPCache JITとは?
PHP8.0から追加 https://wiki.php.net/rfc/jit
ZendVMで実行するのではなく Native Codeを実行する
• 機械語実行により処理速度が最適化 • 同様のことはpcre-jitやJS等でもおなじみ
実行の詳細
None
None
OPCodeをさらに機械語に変換 CPUで直接実行!!
• コード実行が最適化 • JITコンパイルのオーバーヘッドは実行速度で 補填
JITソース v8.0.0
OPCacheが主に関わってくるソースコード JIT関連はopcache/jitに固まっているので 分かりやすい。
opcodeをx86のアセンブラに変換している zend_jit_x86.c
ext/opcache/jit/zend_jit.c - zend_jit_op_array において泥臭い変換処理が行われている - アーキテクチャ依存のコード変換なので未対応だと動作しない - LuaJIT由来のDynAsmを利用
JIT化される単位 - zend_jit_op_array はファイル毎に呼び出し - クラス単位、関数単位でopcodeの最適化が行われて、関数のIOを合わ せた形でZendVMの主処理と繋ぎ合わされる - 1ファイル1関数に全部の処理を入れたら、効果的に効きそう
計測
Laravelの30秒ベンチマーク OPCache − ◯ ◯ Preload − − ◯ Req
/ Sec 111.55 680.42 774.14 Req / Sec (JIT) − 696.57 812.93 ※JIT有効化によって、処理速度は約 2.5〜5%向上
モンテカルロ法を計測
円周率計算のベンチマーク OPCache − ◯ Sec 9.74 8.96 Sec (JIT) −
5.20 ※JIT有効化によって、処理速度は約 42%向上 100,000,000回試行の処理時間
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> ???
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> コード実行の最適化
JITの現状
• https://bugs.php.net/search.php?cmd=display&packa ge_name[]=opcache • RedditのPHP系板 • https://www2.slideshare.net/nikita_ppv/justintime-co mpiler-in-php-8 情報キャッチアップ
使用上の注意
• 内部の実行パスが変わる • 開発も同じ設定にするのが吉 • ファイル更新でopcache_clearとか...
phpunitで使うには これを設定しないと、コマンドライン実行時にopcache が動かない。
まとめ
高速化技術が解決すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> コード実行の最適化
仕組みを理解 適切なアプリケーションに適用 コレ大事!!
参考1 https://speakerdeck.com/hanhan1978/web-application-tuning-guildline
参考2 https://gist.github.com/hellerbarde/2843375 Network IOはメモリアク セスの5万倍遅い
リアルなウェブアプリのボトルネックは、大半 がDBアクセス CPU負荷の数%は全体のボトルネックでは 微々たるもの
本番投入はオススメしづらい... ISUCON用機能なのでは...