デバッグの話 / Debugging for Beginners

Slide 1

Slide 1 text

1 22 デバッグの話慶應義塾大学理工学部物理情報工学科渡辺宙志 2024/10/10 研究室ミーティング主に数値計算屋向けの

Slide 2

Slide 2 text

2 22 注意この資料は一人で小規模なコードを開発する人向け、すなわち自分で入れたバグを自分でデバッグするためのものです。数値計算屋みたいな

Slide 3

Slide 3 text

3 22 典型的な研究スパン年に二編論文を書く → 半年で一つの研究が完結プログラム開発＋計算執筆調査 • 調査：先行研究の調査や、計算手法についての調査 • 開発＋計算：プログラム開発、計算の実行 • 執筆：結果の解析＋論文執筆＋投稿しかし実態は・・・執筆調査デバッグ開発 • 開発時間の大部分はデバッグに費やされている • 初心者であるほど、デバッグの占める割合が長くなる • コードの高速化は、研究時間の短縮にさほど寄与しない計算

Slide 4

Slide 4 text

4 22 デバッグは進捗ではない開発デバッグ開発デバッグ計算解析開発デバッグ計算解析解析計算 Aさん Bさんデバッグは時間がかかり、集中力が要求され、達成感もあるしかし、結局は自分で入れたバグを自分で取る作業(マッチポンプ) 作業している時間が長いのはAさんだが、進捗が出ているのはBさん「デバッグは進捗ではない」ということを肝に銘じること

Slide 5

Slide 5 text

5 22 デバッグの基本哲学「ここまでは大丈夫」という砦を築きながら進む頭を使わないなるべく機械的にチェックできる仕組みを作る頭を使うのは最後の最後だけ安全地帯を作る

Slide 6

Slide 6 text

6 22 デバッグの基本哲学重要な書類をなくしてしまった手当たり次第に探す「ここには無い」という場所を広げる

Slide 7

Slide 7 text

7 22 頭を使わない調べた書類の束を部屋の中においておくと・・・チェック済みチェック済み未チェック「どの束を調べたか」を覚えておかなくてはいけない →デバッグ時は頭を使ってはならない

Slide 8

Slide 8 text

8 22 安全地帯を作るチェック済みの書類は部屋の外に出すまだ調べていないチェック済み砦確実にこっち側には無いあるとすればこっち側デバッグは「ここまでは大丈夫」という領域を広げる作業作業が進むほど「ここは大丈夫」という安全地帯が増える何かを記憶する必要がない(単純作業になる)

Slide 9

Slide 9 text

9 22 デバッグで最も重要なことバグを素早く修正することバグの原因を究明することそもそもバグを入れないことバグを入れないコーディングバグを発見した時の対処法

Slide 10

Slide 10 text

10 22 コードを書く際の注意いきなりコード全体を書いて動作確認してはならない ※特にAIを使う人は注意

Slide 11

Slide 11 text

11 22 例：分子動力学法 1. 相互作用がない粒子の時間発展を調べる周期境界条件の確認自由境界条件(反射壁)の確認 2. 相互作用のある二粒子の衝突を調べるエネルギーが保存することを確認 (カットオフの実装が正しいか？) 運動量が保存することを確認軌道が正しいか確認

Slide 12

Slide 12 text

12 22 例：分子動力学法 3. 相互作用のある二粒子の衝突をまだ調べる周期境界をまたいだ衝突は大丈夫か？斜め方向に衝突した時の軌道は想定通りか？以上のチェックにより以下が「安全地帯」となる • 境界条件の扱い • 力の計算 • エネルギーの計算 (特にカットオフまわり) 多粒子系にしてバグったら、追加で実装した箇所を疑う

Slide 13

Slide 13 text

13 22 例：モンテカルロ法二次元ポッツ模型を書けと言われた →初手で二次元ポッツ模型を書きはじめない 1. スピンが2つしかないイジング模型を書く状態が4つしかないので、厳密解と比較可能エネルギー、磁化などの温度依存性が厳密解と一致することを確認する (スピンフリップの実装が正しいことを確認) 2. 一次元イジング模型を書くエネルギー、磁化などの温度依存性が厳密解と一致することを確認するここまで確認後、一次元ポッツ、二次元イジング、二次元ポッツ、へと進むバグが入ったら、厳密解と一致したところからの差分だけをチェック

Slide 14

Slide 14 text

14 22 バグを見つけた時いきなりコードを修正してはならないバグの原因を特定しないままコードを修正し、正しいと思える振る舞いになったとしても、潜在的にバグが残っていてあとで困ることが多い

Slide 15

Slide 15 text

15 22 バグを見つけたら？ある程度開発が進んだコードでバグを見つけたいきなりデバッグをはじめない A B C デバッグにおいて最重要なのは原因究明「いつのまにかなおっていた」は一番まずい →最初にやることは現場保全

Slide 16

Slide 16 text

16 22 バグを見つけたら？まず再現性の確認 • 本当にバグってる？ • どの環境で、どのインプットファイルを使い、どんな実行方法で、どんなバグが出たかを確定させる • ビルドミスはないか？正しいインプットファイルを渡しているか？実行方法は正しいか？現場保全 • デバッグ用ブランチを作成し、バグが発生するソースを保存 • 研究日記(←書いてるはず)に、ブランチ名と発生条件を記録安全地帯の確保 • 「ここまではバグっていなかったはず」まで戻り、動作を確認 • 一番最新の「バグっていないコード」を安全地帯として確保するここまで動作確認と単純作業しかしていないデバッグはなるべく頭を使わない

Slide 17

Slide 17 text

17 22 デバッグの基本は比較できる限り現時点に近い安全地帯を確保し、容疑者を限定してからデバッグを開始するバグっていなかったコード(安全地帯) バグったコード安全地帯からの修正箇所バグが混入したとしたら、ここ

Slide 18

Slide 18 text

18 22 例：LAMMPS 何か複雑な初期状態や境界条件(外力など)を加えたインプットファイルが動作しないファイルを修正しながら期待する動作になるまで何度も実行する確実に動作するファイルを探し、動作しないファイルとの差を調べる

Slide 19

Slide 19 text

19 22 二分探索コードを実行したらSegmentation Faultと言われて止まったやってはならないことソースを見ながら原因を探してはならない特に頭の中でトレース実行するのはダメデバッグはなるべく頭を使わないやるべきことまず、どこで止まったかを調べる → print文による二分探索 void func() { printf("1¥n"); // 何か処理 printf("2¥n"); // 何か処理 printf("3¥n"); } 出力が「1」ならこの間で止まっている出力が「12」ならこの間で止まっている場所を限定してから原因を考える

Slide 20

Slide 20 text

20 22 二分探索コードを実行したら実行直後に死ぬようになってしまった実行直後に死ぬのでprint文デバッグが使えない →こういう時も二分探索 int main(){ hoge(); fuga(); piyo(); hogehoge(); } こいつが死んだ int main(){ /* hoge(); fuga(); piyo(); hogehoge(); */ } すべてコメントアウトして動作確認※ int main(){ hoge(); fuga(); /* piyo(); hogehoge(); */ } 後半だけコメントアウトして動作確認 ※「ここは絶対大丈夫」というところまで一度戻るのが大事 • ビルドに失敗しているのに気づかずに古い実行バイナリを見ていた • 間違ったライブラリをリンクしていた • そもそも実行方法を間違えていた「ここは絶対大丈夫」がわりと大丈夫でなかったりする

Slide 21

Slide 21 text

21 22 AIとの付き合い方 ◯◯モデルのシミュレーションをするコードを生成してください生成されたコード問題が起きた時に比較対象が存在しない→コードすべてを調べる必要がある他人が書いたコードをデバッグするのは極めて困難(自分のも大変なのに) いきなりコード全体を生成させてはならない AIの使用例 • 関数単位で生成し、その度にテストする • エラーメッセージからバグの原因を推定させる • モデルの数式をコード化させる • 自分のコードをチェックさせる • etc.

Slide 22

Slide 22 text

22 22 まとめデバッグでは、まず安全地帯を確保する「ここまでは絶対大丈夫」を確保する大丈夫なコードとダメなコードを比較することでバグがある場所を限定するデバッグでは、頭を使わない print文やコメントによる二分探索など、やるべきことを単純作業に落とすデバッガやIDEの利用を覚えるのは、上記の基礎ができてからの方が良いと思う