Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AutoML パッケージの開発を円滑に進めたい / How to develop AutoML...

Kon
July 19, 2019

AutoML パッケージの開発を円滑に進めたい / How to develop AutoML package

Kon

July 19, 2019
Tweet

More Decks by Kon

Other Decks in Science

Transcript

  1. Yu Ohori (a.k.a. Kon) NS Solutions Corporation (Apr 2017 -

    ) • Researcher • Data Science & Infrastructure Technologies • System Research & Development Center • Technology Bureau @Y_oHr_N @Y-oHr-N #SemiSupervisedLearning #AnomalyDetection #DataOps
  2. 約 3 ヶ月,同僚 3 名と以下の大会に参加した April 1, 2019 - July

    20, 2019 3 任意のデータセットに対 する予測精度を競う大会 https://www.4paradigm.com/competition/kddcup2019
  3. 本大会の課題は? 時系列データの扱い • data leak を予防する方法は? • concept drift に対応する方法は?

    複数表の扱い • 一対多,多対多で結ばれる表を結合する方法は? 4 つの型の扱い • cat 型を num 型に変換する方法は? • multi-cat 型を num 型に変換する方法は? • time 型を num 型に変換する方法は? 6
  4. どうやってこれらの問題を解決したか? Codecov カバレッジを記録 CircleCI テストを実行 Comet.ml 学習結果を記録 開発者 変更を push/PR

    GitHub 外部サービスに通知 テスト及び CV スコアの監視を継続的に行い,バグの混入を早急に察知する 10
  5. 何を学習結果として記録したか? • commit ID • ブランチ名 • 実行日時 • 計算時間

    • 標準出力 • 依存関係 • 学習曲線 • CV スコア • ベストパラメータ • 等 12