Slide 1

Slide 1 text

© 2024 Fujitsu Limited 2024/06/16 数村憲治 Javaプロファイラの 信頼性とバイアスへの 付き合い方 JJUG CCC Spring 2024 @kkzr

Slide 2

Slide 2 text

プロファイラの概要とバイアス バイアスの仕組み プロファイラの実態 バイアスへの対処 アジェンダ

Slide 3

Slide 3 text

3 © 2024 Fujitsu Limited © 2024 Fujitsu Limited 自己紹介 Jakarta EE 仕様策定委員 MicroProfile ステコミ委員 JCP Executive Committee メンバー Eclipse Foundation ボードディレクター EclipseCon、 JakartaOne、JJUGなどで登壇 3

Slide 4

Slide 4 text

プロファイラの概要とバイアス バイアスの仕組み プロファイラの実態 バイアスへの対処 アジェンダ

Slide 5

Slide 5 text

5 プロファイラ分類 © 2024 Fujitsu Limited 正確にトレースできるが重い。 gprof、BCIなど。 あまり使われていない? 確率的。 プロファイラ インストゥルメント (instrumentation) サンプリング 本日の テーマは こちら

Slide 6

Slide 6 text

6 サンプリング成立条件 © 2024 Fujitsu Limited 十分なサンプリング数 計測時間を長くするか、サンプリング間隔を短くする オーバーヘッド・副作用が少ない JIT(インライン等)に影響 確率的なサンプリング分布

Slide 7

Slide 7 text

7 プロファイラとバイアス © 2024 Fujitsu Limited ほぼすべてのプロファイラにはバイアスがある ランニングスレッド4つだけサンプリングする Javaメソッドだけサンプリングする 10ミリ秒ごとにサンプリングする ・・・ 例

Slide 8

Slide 8 text

8 プロファイラの正しさ © 2024 Fujitsu Limited 「正しさ」の定義は難しい コスト分布が分からないのでプロファイラを使う 正しいコスト分布が分かっているなら、 プロファイラを使う必要はない どちらが「正しい」かは重要ではない プロファイラX 80% 20% メソッドA メソッドB プロファイラY 70% 30% メソッドA メソッドB

Slide 9

Slide 9 text

9 アクション可能なプロファイラ © 2024 Fujitsu Limited プロファイラの結果からアクション可能か、が大事 アクション可能な例 プロファイラX 80% 20% メソッドA メソッドB プロファイラY 70% 30% メソッドA メソッドB 「メソッドAをチューニング」というアクション設定が可能

Slide 10

Slide 10 text

10 アクション不可能な例 © 2024 Fujitsu Limited プロファイラX 80% 20% メソッドA メソッドB プロファイラY 70% 30% メソッドA メソッドB どちらかが間違っているか、どちらも間違っているか 主な理由は、バイアスと副作用 なので、プロファイラのバイアスを知っておくのが大切

Slide 11

Slide 11 text

プロファイラの概要とバイアス バイアスの仕組み プロファイラの実態 バイアスへの対処 アジェンダ

Slide 12

Slide 12 text

12 確率的でないサンプリング分布例 © 2024 Fujitsu Limited 10ミリ秒ごとのサンプリング 時間 スレッド1 コンテキストスイッチ キャッシュミスが多い 10ms セーフポイントバイアス スレッドダンプ CPU スレッド2 スレッド3 スレッド1 10ms 10ms

Slide 13

Slide 13 text

13 セーフポイント © 2024 Fujitsu Limited スレッドの状態が、安全・安定している場所 安全な例 危険な例 スタック メモリ Javaヒープ CPU レジスタ スタック メモリ スレッド スレッド オブジェクト オブジェクト 0x20000 0x30000 R4 R1 R3 R2 CPU レジスタ R4 R1 R3 R2

Slide 14

Slide 14 text

14 セーフポイント仕組み © 2024 Fujitsu Limited スレッドを制御する信号機みたいなもの ~通常時~ 信号は青 アプリケーションは走り続ける

Slide 15

Slide 15 text

15 セーフポイント仕組み © 2024 Fujitsu Limited スレッドを制御する信号機みたいなもの ~セーフポイント開始時~ JVMが信号を赤にする アプリケーションは信号に到達したら止まる Java VM

Slide 16

Slide 16 text

16 セーフポイント仕組み © 2024 Fujitsu Limited スレッドを制御する信号機みたいなもの ~セーフポイント時~ 信号は赤 アプリケーションは最寄りの信号で止まっている Java VM

Slide 17

Slide 17 text

17 セーフポイント仕組み © 2024 Fujitsu Limited スレッドを制御する信号機みたいなもの ~セーフポイント終了時~ JVMが信号を青にする アプリケーションは走りだす Java VM

Slide 18

Slide 18 text

18 test命令によるセーフポイント実装 © 2024 Fujitsu Limited mov 0x458(%r15),%r11 test %eax,(%r11) %r15 スレッド ポインタ 0x458 bad page Java VMが goodpage または badpageを設定 アクセス可能ページ アクセス不可ページ メモリ シグナルハンドラ経由で セーフポイント good page スレッド オブジェクト(C++) 単なるメモリアクセス

Slide 19

Slide 19 text

19 セーフポイント設置場所 © 2024 Fujitsu Limited セーフポイント カウントありループ for (int i = 0 ; i < m ; ++i) { ・・・ } while (flag == true) { ・・・ } カウントなしループ セーフポイントは 設定されない カウントなしループ メソッド終了 JNI呼出し終了

Slide 20

Slide 20 text

20 セーフポイント設置場所 © 2024 Fujitsu Limited -XX:-UseCountedLoopSafepoints で制御可能 最近のJVMではカウントありでも なしでも、セーフポイントが設置 カウントなしループ メソッド終了 JNI呼出し終了 カウントありループ for (int i = 0 ; i < m ; ++i) { ・・・ } セーフポイントは 設定されないる

Slide 21

Slide 21 text

プロファイラの概要とバイアス バイアスの仕組み プロファイラの実態 バイアスへの対処 アジェンダ

Slide 22

Slide 22 text

22 プロファイラの実行ステップ © 2024 Fujitsu Limited ハイブリッドプロファイラ サンプリング (PC採取) スタックトレース (FP walk) スタックトレース採取 (Javaスレッドダンプ) シンボルと照合し表示 一般的プロファイラ サンプリング (PC採取) スタックトレース (FP walk) シンボルと照合し 表示 Javaプロファイラ スタックトレース採取 (Javaスレッドダンプ) 表示

Slide 23

Slide 23 text

23 JavaスレッドダンプAPI © 2024 Fujitsu Limited Java API JVMTI API Thread.getAllStackTraces() Thread.getStackTrace() GetStackTrace() GetAllStackTraces() https://docs.oracle.com/javase/jp/21/docs/specs/jvmti.html#stack https://docs.oracle.com/javase/jp/21/docs/api/java.base/java/lang/Thread.html#getStackTrace() https://docs.oracle.com/javase/jp/21/docs/api/java.base/java/lang/Thread.html#getAllStackTraces() いずれもsafepointで実施

Slide 24

Slide 24 text

24 AsyncGetCallTrace © 2024 Fujitsu Limited https://bugs.openjdk.org/browse/JDK-8178287 void AsyncGetCallTrace (ASGCT_CallTrace *trace, jint depth, void* ucontext) hotspot/share/prims/forte.cpp https://openjdk.org/jeps/435 非公開API 問題もあり 公開APIにする動きあり

Slide 25

Slide 25 text

25 Java Flight Recorder サンプリング機能 © 2024 Fujitsu Limited 二種類のサンプリング Method Profiling Sample Method Profiling Sample Native CPUで実行中あるいは実行キューにあるJavaコードが対象 以下はサンプリング対象外 JVMにより停止中のスレッド (block/wait/sleepなど) JVMコード実行中のスレッド (GCなど) CPUで実行中あるいは実行キューにあるネイティブコードが対象

Slide 26

Slide 26 text

26 JFR仕組み © 2024 Fujitsu Limited スレッドダンプAPIは使っていない セーフポイントバイアスはない (サンプリング時は) JVM(HostSpot)のSR機構を使いスレッドを停止 Linuxの場合は、SIGUSR2を使用 シンボル照合はセーフポイントバイアスになる -XX:+UnlockDiagnosticVMOptions -XX:+DebugNonSafepoints で緩和

Slide 27

Slide 27 text

27 JFRの実行ステップ © 2024 Fujitsu Limited サンプリング スタックトレース シンボルと照合 SIGUSR2/SuspendThread AsyncGetCallTrace

Slide 28

Slide 28 text

28 perfコマンド © 2024 Fujitsu Limited アプリケーションから カーネル層まで対応 CPUイベントベース Java VM(JIT)も対応

Slide 29

Slide 29 text

29 perfコマンドの実行ステップ © 2024 Fujitsu Limited サンプリング スタックトレース シンボルと照合 perf event/PMUを利用 ネイティブ部分はELF。 Java部分は、別途JVMで シンボルマップの作成が必要 jcmd Compiler.perfmap FPベースのstack walk JVMで細工が必要 -XX:+PreserveFramePointer

Slide 30

Slide 30 text

30 async-profilerの実行ステップ © 2024 Fujitsu Limited サンプリング スタックトレース シンボルと照合 perf event/PMUを利用 ネイティブ部分は、 FPベースのstack walk Java部分は、 AsyncGetCallTrace ネイティブ部分はELF

Slide 31

Slide 31 text

プロファイラの概要とバイアス バイアスの仕組み プロファイラの実態 バイアスへの対処 アジェンダ

Slide 32

Slide 32 text

32 メソッド・関数の種類 © 2024 Fujitsu Limited Javaコード インタプリタ JITコード 組込みコード Java VMコード GCなど ネイティブコード ユーザスペース カーネルスペース

Slide 33

Slide 33 text

33 プロファイラ比較 © 2024 Fujitsu Limited VisualVM JFR perf async- profiler safepoint bias サンプリング シンボル照合 N/A N/A Javaスタック インタプリタ は不可 組込みコード も可 ネイティブス タック カーネルス タック サポートOS ほぼすべて ほぼすべて Linux Linux/macOS

Slide 34

Slide 34 text

34 © 2024 Fujitsu Limited プロファイラの仕組みを知っておくと、 バイアスが想像しやすい 正しい結果ではなく、アクション可能な結果 サマリ プロファイラのバイアスは、排除するのは難しいので、 バイアスを知ったうえで、結果を活用する

Slide 35

Slide 35 text

© 2024 Fujitsu Limited Question? 35

Slide 36

Slide 36 text

Thank you © 2024 Fujitsu Limited