Upgrade to Pro — share decks privately, control downloads, hide ads and more …

dagstreamでデータ前処理の順序関係を解決する #stapy105

dagstreamでデータ前処理の順序関係を解決する #stapy105

みんなのPython勉強会105回LT発表資料

Riku Sakamoto

June 20, 2024
Tweet

More Decks by Riku Sakamoto

Other Decks in Technology

Transcript

  1. データ前処理 データ前処理 • データのサニタイズ • 特徴量の生成 • データ拡張 コーディング面での特徴 •

    仕様の変更、拡張が頻繁に発生する • 処理の順序関係が重要である場合が多い データ前処理部におけるコードの品質は重要 (メンテナンスのしやすさ) データ前処理 機械学習モデル ポスト処理 機械学習システムの流れ 3
  2. まとめ • dagstreamは以下のことができます ◦ 前処理の順序関係を定義 ◦ 前処理間のパイプ(結果の受け渡し)を定義 ◦ 順序関係の可視化(mermaid 形式)

    ◦ 順序関係に沿った直列・並列実行 ◦ 部分的な順序関係の抽出 ◦ GitHub: https://github.com/ricosjp/dagstream   7
  3. 8