Pro Yearly is on sale from $80 to $50! »

BCC Developer Tutorial 副読本

2cf373725ded741824c50fd571eda6e1?s=47 KONDO Uchio
September 08, 2020

BCC Developer Tutorial 副読本

2cf373725ded741824c50fd571eda6e1?s=128

KONDO Uchio

September 08, 2020
Tweet

Transcript

  1. PEPABO SUMMER INTERN VERSION 近藤うちお / GMO Pepabo, Inc. 2020.09.08

    bcc Python
 Developer Tutorial 徹 底 解 説 !
  2. この資料は何 •Python版「bcc Python Developer Tutorial」を通しでやってみる 際に参考になるかもしれない解説スライドです •@udzura の独断と偏見が含まれます •@udzura はRuby版BCCポート(*)を開発した人で、TutorialもRuby

    に移植した経験がありますが、それでも間違ったことを言っている可 能性はあります。 IUUQTHJUIVCDPNVE[VSBSCCDD
  3. 全体の攻略方針 •三分割できる •Lesson 1〜6: 第一章 BCCプログラミングの基本 •Lesson 7〜11: 第二章 収集したデータの出力方法

    •Lesson 12〜16: 第三章 様々なるProbe •とにかく第一章が重要で難しい。 •ここさえ乗り切れば後はAPIを覚えていくフェーズになる。 •インターンの半分でLesson 6までやり切れば、ツールは何とか作れるはず?
  4. 環境について •Ubuntu Bionic で大丈夫 •カーネル 5.3 あたりを明示的に入れたければどうぞ。
 その場合、linux-libc-dev パッケージを先のバージョンから
 ダウンロードして入れても良いかも。

    •Focal はなんか不安定な印象がまだあるが、挑戦はいいんでは •Vagrant を使えば十分、むしろコンテナでは如何ともし難い •Linux の人も、いちおうVMを挟んでおきましょう
  5. 第一章 BCCプログラミングの基本

  6. 1. Hello World

  7. BCCの動作確認 •やってることは: clone(2) のトレース •clone(2) は要するにfork()で、プロセスを作ったら呼ばれるsyscall •fork() -> exec() ->

    exit() の流れを復習しよう
  8. 2. sys_sync()

  9. 対象システムコールの変更 •kprobe__sys_BAR(...) という関数名をBCCで定義すると、
 自動でkprobeにアタッチされる。 •sys_BAR kprobe はシステムコール BAR(2) に対応する ※

    hello_world.py を改修する ※kprobe = カーネルのシンボルに紐づくフック
  10. 3. hello_fields.py

  11. プログラムの基本形を覚える ※ printk() したら msg で取れる

  12. 4. sync_timing.py

  13. BPF Mapの基本的な使い方

  14. BPF Mapの基本的な使い方

  15. BPF Mapの基本的な使い方

  16. 5. sync_count.py

  17. 前のコードを改修しよう • ヒントなど: • key に 0 以外を指定すればストアする 値を増やせるよ(不要か?) •

    lookup()してNULLなら初期値、
 そうでなければ +1 した値を保存すれ ばカウンターになるのでは? • もう差を取る必要は実はない • outputの手段は今のとこprintk()しか ありませんね...
  18. 6. disksnoop.py

  19. ブロックデバイスI/Oのトレース例 •押さえるべきこと: •trace_start()からtrace_completion()までの差分を計測している •struct request * のアドレスをキーがわりにする •一回一回のリクエスト構造体はカーネルのメモリ上では別々の位置 にあるはず(アドレスの使い回しはあるが、同時にはない) •printk()

    で無理やり3つの値を送っている
  20. 自力でゆっくり 読んでみましょう

  21. 第二章 収集したデータの出力方法

  22. 7. hello_perf_output.py

  23. Perf buffer の使い方 •コツ: •trace_fields() 系はtracefsの一つのファイルをtailしてるだけで、 複数同時にアウトプットできなくて混ざる •Perf bufferにデータを送り込む専用のデータ構造
 BPF_PERF_OUTPUT()

    •open_perf_buffer() はデータが来たときのコールバックの登録 •perf_buffer_poll() で待つ
  24. 8. sync_perf_output.py

  25. 4. の書き換え。 •コツ: •7. のコード構造を頭に叩き込んで落ち着いて頑張る。

  26. 9. bitehist.py

  27. ヒストグラムの出し方 •コツ: •ヒストグラム専用のデータ構造とヘルパーがあって便利ですね •struct request のメンバの確認の仕方などを押さえとくといい

  28. 10. disklatency.py

  29. disksnoop.py のリライト •コツ: •レイテンシ計測のパターンを思い出す •あとはレイテンシをヒストグラムに登録するだけ

  30. 11. vfsreadlat.py

  31. 定期表示系のトレーサの実装 •コツ: •CとPythonのファイル分割、b["dist"].clear() の2つの方法を
 覚えるためのレッスン。 •他は新しいことはないので復習。

  32. 第三章 様々なるProbe、そして伝説へ...

  33. 12. urandomread.py

  34. tracepoint の利用 •コツ: •普通にtracepointを使う場合専用のマクロがある •マクロ経由の場合明示的なアタッチは不要 •tracepoint のフォーマット確認の仕方を押さえる

  35. ちなみに •@udzura が雑に書いたtracepoint補完確認コマンドがある。 • https://gist.github.com/udzura/6d40a3f010aff2a4a58f632627ab7f89

  36. 13. disksnoop.py fixed

  37. kprobe → tracepoint の書き換え •コツというか...: •trepo() を使って当該tracepointの確認を... •してもよくわからんとなった場合は、 @udzura のRuby実装を眺め

    てもいいと思います。 •トレースポイント、ドキュメントがないよね...。
  38. 14. strlen_count.py

  39. uprobe の利用 •コツ: •地味に初めて「文字列をキーとしたハッシュ」を扱うので注意 •その他は既存のProbeと扱いは変わらない •get_table() で取れるテーブルはdict風のインタフェースがある

  40. uprobe の確認方法 •1) readelf -s •2) bpftrace (ただし、snap版は使えない)

  41. 15. nodejs_http_server.py

  42. USDTの利用... •コツというか...: •node.jsをUSDT有効で用意するのが大変。頑張って •ヒント: “同じディレクトリにあるnode.jsのサーバプログラムを、 USDTを有効にした(--enable-dtrace)ビルドのnode.jsバイナリ で実行して計測する必要があります” •nodebrew はビルドオプションを渡せる。もしくは自分でbuild •USDT有効になっても、さらにusdt系の関数は癖があって大変。

  43. USDTの確認方法 •1) readelf -n

  44. USDTの確認方法 •2) bpftrace

  45. 16. task_switch.c

  46. ここまでの総集編 •コツというか...: •finish_task_switch() の定義をちゃんとカーネルソースコードを見て 確認するといいと思う •eBPF C側の関数の第2引数以降は、元の関数の引数がスライドする •後は、今までの知識で!

  47. 17. Further Study

  48. 登り始めた ばかりだからな...(AA略)