Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
受託分析屋がKubeflowを使って思うこと_KubeflowMeetup_1.pdf
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Kazusa
September 26, 2018
Technology
2
2.5k
受託分析屋がKubeflowを使って思うこと_KubeflowMeetup_1.pdf
Kubeflowでモデルをデプロイする時に必要になってくる、学習(実験)の管理やモデル管理について話しました
Kazusa
September 26, 2018
Tweet
Share
More Decks by Kazusa
See All by Kazusa
20190208_MLSE_NeurIPS2018_tkazusa.pdf
tkazusa
1
790
機械学習どこから手をつけよう? Google DevFest 2018 Tokyo
tkazusa
2
1.3k
機械学習システム開発及び運用にかかる 不確実を考慮した要件定義の考察および提案
tkazusa
0
360
【論文読み】GCVAE-GAN Fine-Grained Image Generation through Asymmetric Training
tkazusa
0
140
【論文読み】Graph Convolutional Networks for Classification with a Structured
tkazusa
0
70
Other Decks in Technology
See All in Technology
OCI Database Management サービス詳細
oracle4engineer
PRO
1
7.4k
制約が導く迷わない設計 〜 信頼性と運用性を両立するマイナンバー管理システムの実践 〜
bwkw
3
1.1k
私たち準委任PdEは2つのプロダクトに挑戦する ~ソフトウェア、開発支援という”二重”のプロダクトエンジニアリングの実践~ / 20260212 Naoki Takahashi
shift_evolve
PRO
2
210
AWS Network Firewall Proxyを触ってみた
nagisa53
1
250
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
530
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
Embedded SREの終わりを設計する 「なんとなく」から計画的な自立支援へ
sansantech
PRO
3
2.6k
Cosmos World Foundation Model Platform for Physical AI
takmin
0
980
SRE Enabling戦記 - 急成長する組織にSREを浸透させる戦いの歴史
markie1009
0
170
【Oracle Cloud ウェビナー】[Oracle AI Database + AWS] Oracle Database@AWSで広がるクラウドの新たな選択肢とAI時代のデータ戦略
oracle4engineer
PRO
2
190
茨城の思い出を振り返る ~CDKのセキュリティを添えて~ / 20260201 Mitsutoshi Matsuo
shift_evolve
PRO
1
430
Claude Code for NOT Programming
kawaguti
PRO
1
110
Featured
See All Featured
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
750
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
350
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
120
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
320
KATA
mclloyd
PRO
34
15k
Skip the Path - Find Your Career Trail
mkilby
0
60
A Soul's Torment
seathinner
5
2.3k
Building an army of robots
kneath
306
46k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Become a Pro
speakerdeck
PRO
31
5.8k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Transcript
受託分析屋がKubeflow を使って思うこと 2018/9/26 Kubeflow Meetup #1 (Cloud Native Meetup Tokyo
#5) Taketoshi Kazusa @tkazusa
自己紹介 • 上総 虎智 Taketoshi Kazusa • Github: tkazusa /
Twitter: @tkazusa • BrainPad Inc. 分析官 • 最近のおもちゃ Kubeflow 0.1
自己紹介 • 上総 虎智 Taketoshi Kazusa • Github: tkazusa /
Twitter: @tkazusa • BrainPad Inc. 分析官 • 最近のおもちゃ
今日のお題 KubeCon CloudNativeCon Europe 2018
今日のお題
今日のお題
Continuous integration & deployment of models • Every night my
model is automatically retrained on my latest logs • If the new model is better it is automatically pushed into production
MLシステム継続的デプロイこんな感じ? アプリケーション エンジニア データサイエンティスト MLエンジニア Experiment Jobs (Training) ML Service
Services App image ML Training image ユーザー ・data ・model ・config Storage k8a k8a Container Repository
MLシステム継続的デプロイこんな感じ? Experiment Jobs (Training) ML Service Services App image ML
Training image ・data ・model ・config Storage k8a k8a Container Repository アプリケーション エンジニア データサイエンティスト MLエンジニア ユーザー
MLシステム継続的デプロイこんな感じ? Experiment Jobs (Training) ML Service Services App image ML
Training image ・data ・model ・config Storage k8a k8a Container Repository アプリケーション エンジニア データサイエンティスト MLエンジニア ユーザー
なんか良さげ けど、これで全部いける?
Serving自動でいいんでしたっけ? Experiment Jobs (Training) ML Service Services App image ML
Training image ・data ・model ・config Storage k8a k8a Container Repository アプリケーション エンジニア データサイエンティスト MLエンジニア ユーザー
ワンクッション挟みたくなる Experiment Jobs (Training) ML Service Services App image ML
Training image ・data Storage k8a k8a ・メトリクスひとつじゃない ・セグメントごとの指標 ・機械学習の公平性 ・学習(実験)時の試行錯誤の 結果を一覧で見たい ・model ・config Serving model ・model ・config ・model ・config Container Repository アプリケーション エンジニア データサイエンティスト MLエンジニア ユーザー
ワンクッション挟みたくなる アプリケーション エンジニア データサイエンティスト MLエンジニア Experiment Jobs (Training) ML Service
Services App image ML Training image ユーザー ・data Storage k8a k8a ・メトリクスひとつじゃない ・セグメントごとの指標 ・機械学習の公平性 ・Train時の試行錯誤の結果を 一覧で見たい ・model ・config Serving model ・model ・config ・model ・config Experiment Management
ワンクッション挟みたくなる アプリケーション エンジニア データサイエンティスト MLエンジニア Experiment Jobs (Training) ML Service
Services App image ML Training image ユーザー ・data Storage k8a k8a ・メトリクスひとつじゃない ・セグメントごとの指標 ・機械学習の公平性 ・Train時の試行錯誤の結果を 一覧で見たい ・model ・config Serving model ・model ・config ・model ・config IntegrateされるTFMA 一瞬、話題になったCometML 話題にすらならいmlflow
TensorFlow Model Analysis (TFMA) • モデルをデプロイする場合に必要な評価を探索的にも行える • ああ
Experiment management tools • いつ、だれが、どのスクリプト、どんなハイパラで学習させて、ど んな評価になったのか?が一覧性を持って管理したい • なんなら、必要に応じて検索できて欲しい
Experiment management tools • いつ、だれが、どのスクリプト、どんなハイパラで学習させて、ど んな評価になったのか?が一覧性を持って管理できる • 必要に応じて検索ができる
Experiment management tools • いつ、だれが、どのスクリプト、どんなハイパラで学習させて、ど んな評価になったのか?が一覧性を持って管理できる • 必要に応じて検索ができる Katibでいける? 大嶋さんに聞き
たくなった。
Experiment management tools • いつ、だれが、どのスクリプト、どんなハイパラで学習させて、ど んな評価になったのか?が一覧性を持って管理できる • 必要に応じて検索ができる デ、データ。。。
Experiment management tools • いつ、だれが、どのスクリプト、どんなハイパラで学習させて、ど んな評価になったのか?が一覧性を持って管理できる • 必要に応じて検索ができる
欲しくない? 僕は欲しい。
人間挟んでServingで終わり? アプリケーション エンジニア データサイエンティスト MLエンジニア Experiment Jobs (Training) ML Service
Services App image ML Training image ユーザー ・data Storage k8a k8a ・model ・config Serving model ・model ・config ・model ・config Container Repository
Serveし終わったモデルってどうしてる? アプリケーション エンジニア データサイエンティスト MLエンジニア Experiment Jobs (Training) ML Service
Services App image ML Training image ユーザー ・data Storage k8a k8a ・model ・config Serving model ・model ・config ・model ・config Serving model Serving model Serving model ・モデルの挙動に対する説明責任 ・機械学習の公平性 ・再現性の担保 ・過去のモデル/データ/コ ンフィグの版管理 Container Repository
過去に作ってServeしたモデルってどうしてる? アプリケーション エンジニア データサイエンティスト MLエンジニア Experiment Jobs (Training) ML Service
Services App image ML Training image ユーザー ・data Storage k8a k8a ・model ・config Serving model ・model ・config ・model ・config Serving model Serving model Serving model ・モデルの挙動に対する説明責任 ・機械学習の公平性 ・再現性の担保 ・過去のモデル/データ/コ ンフィグの版管理 Model Management
過去に作ってServeしたモデルってどうしてる? アプリケーション エンジニア データサイエンティスト MLエンジニア Experiment Jobs (Training) ML Service
Services App image ML Training image ユーザー ・data Storage k8a k8a ・model ・config Serving model ・model ・config ・model ・config Serving model Serving model Serving model ・モデルの挙動に対する説明責任 ・機械学習の公平性 ・再現性の担保 ・過去のモデル/データ/コ ンフィグの版管理 まだない?
試行錯誤中。
まとめ • “Continuous integration & deployment of models“をシンプルに実 装できるならまじ良さげ •
けど、毎日再学習&良ければPushが最適解じゃ無い場合もある • Experiment ManagementやModel Management、Model Analysis に期待しているけど、まだもうちょっと先になるのかな • もしくは他のツールとの組み合わせ?試行錯誤中
ありがとうございました http://www.brainpad.co.jp/recruit/ 株式会社ブレインパッドの採用情報見て下さい
参考情報 • https://schd.ws/hosted_files/kccnceu18/d4/Kubeflow_Deep_Dive.pdf • https://medium.com/tensorflow/introducing-tensorflow-model- analysis-scaleable-sliced-and-full-pass-metrics-5cde7baf0b7b • https://www.mlflow.org/docs/latest/tracking.html#tracking-ui