Upgrade to Pro — share decks privately, control downloads, hide ads and more …

gokartの分散並列化ライブラリkannonの紹介 @【Sansan×エムスリー】gokar...

gokartの分散並列化ライブラリkannonの紹介 @【Sansan×エムスリー】gokartで爆速開発!MLOps勉強会

登壇概要
gokartのタスクパイプラインの一部をk8s上で簡単に分散並列化できるライブラリkannonを紹介します。
kannonはgokartのラッパであり、複数のk8s jobにタスクを分散して並列で実行することができます。 MLパイプラインではしばしば分散並列化可能な部分が存在しますが、gokartのシングルスレッド実行が障壁となります。kannonはこれを解決するライブラリです。

登壇者プロフィール
東京大学 工学部 電子情報工学科所属のB4。大学では大規模画像検索を研究。2023年3月にエムスリーAIチームにてインターンに参加し、kannonを開発。現在はエムスリーに業務委託として参画。

Yutaro Oguri

July 12, 2023
Tweet

More Decks by Yutaro Oguri

Other Decks in Programming

Transcript

  1. 自己紹介 • Yutaro Oguri (小栗 悠太郎) (@irungo_ic) • 東京大学 工学部

    電子情報工学科B4 • 2023/03にエムスリーAIチームにてインターン • kannon開発 • その後、業務委託として参画 2
  2. gokartの並列分散化: 課題 • gokart only = シングルスレッド実行 • パイプラインを複数のマシンに分散する上での課題 ◦

    Task依存関係を解決しつつ、 ◦ 分散するTaskを識別しつつ、 ◦ どうやって分散するか? 5
  3. kannon: アーキテクチャ “Master Job” … GCS Bucket (Cache) save &

    load cache create job Master Jobが 中央管理 8
  4. kannon: アーキテクチャ “Master Job” … GCS Bucket (Cache) save &

    load cache create job 全Job共有のキャッ シュ 10
  5. まとめ • kannonのtutorialを試してみてください! • contributionお待ちしております! • Repo: https://github.com/m3dev/kannon • Tutorial:

    https://github.com/m3dev/kannon/blob/main/example/README.md • Tech Blog: https://www.m3tech.blog/entry/2023/03/14/180137 24