Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ClearMLで行うAIプロジェクトの管理(レポート,最適化,再現,デプロイ,オーケストレーション)
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Ringa_hyj
December 31, 2024
Technology
240
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ClearMLで行うAIプロジェクトの管理(レポート,最適化,再現,デプロイ,オーケストレーション)
Ringa_hyj
December 31, 2024
More Decks by Ringa_hyj
See All by Ringa_hyj
DVCによるデータバージョン管理
ringa_hyj
0
390
deeplakeによる大規模データのバージョン管理と深層学習フレームワークとの接続
ringa_hyj
0
110
Hydraを使った設定ファイル管理とoptunaプラグインでのパラメータ探索
ringa_hyj
0
230
Catching up with the tidymodels.[Japan.R 2021 LT]
ringa_hyj
3
880
多次元尺度法MDS
ringa_hyj
0
360
因子分析(仮)
ringa_hyj
0
200
階層、非階層クラスタリング
ringa_hyj
0
160
tidymodels紹介「モデリング過程料理で表現できる説」
ringa_hyj
0
680
深層学習をつかった画像スタイル変換の話と今までの歴史
ringa_hyj
0
490
Other Decks in Technology
See All in Technology
先取りMaven4 ~16年ぶりのメジャーアップデート、その進化とは?~
ogiwarat
0
150
Databricks における 生成AIガバナンスの実践
taka_aki
1
330
Agentic Defenseとともにセキュリティエンジニアが輝き続けるには / How Security Engineers Can Keep Excelling with Agentic Defense
yuj1osm
0
110
データ基盤をDataformで整えた話 〜 開発環境を添えて 〜
takapy
0
120
Rubyで音を視る
ydah
1
100
関西に縁あるMicrosoft MVPsが語るCopilotの未来
kasada
0
1.2k
AI-DLCを活用した高品質・安全なAI駆動開発実践 / AI Driven Development with AI-DLC
yoshidashingo
0
140
はじめてのDatadog
kairim0
0
290
Dynamic Workersについて
yusukebe
2
610
Sony_KMP_Journey_KotlinConf2026
sony
2
210
サイバーセキュリティ概論 / Introduction to Cybersecurity
ks91
PRO
0
170
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
190
Featured
See All Featured
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
820
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
6k
Between Models and Reality
mayunak
4
330
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
160
Designing for Timeless Needs
cassininazir
1
250
Making the Leap to Tech Lead
cromwellryan
135
9.9k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
Odyssey Design
rkendrick25
PRO
2
690
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
240
Are puppies a ranking factor?
jonoalderson
1
3.5k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
720
Balancing Empowerment & Direction
lara
6
1.1k
Transcript
紹介 1/6 はじめに ClearMLの目的は・・・ 実験管理から本番デプロイまでの機械学習プロジェクト の全体を自動化/可視化するプラットフォーム こんな経験はありませんか? • 実験結果やモデル、パラメータの管理が煩雑で、以前の実験の再現が困難 •
複数人での実験結果や進捗状況の共有に時間がかかる • 異なる計算機で複数の処理を経由する実験過程や複雑な実験環境が再現できない • パラメータやデータを変更して性能を比較することが難しい • チーム共有のマシンでGPUリソースの使用状況が不透明 • 作成したモデルをすぐにデプロイできず困っている
紹介 2/6 チューニング/学習機能 2行のコードで実験を記録しサーバーへ保存 DataOps Tuning Train Reports Modelstore Pipelines
Deploy Reproducibility Orchestrate from clearml import Task Task.init(project_name='main_project/sub_project', task_name='test') • 容易な実行環境/結果の保存 • データ, モデルを自動or手動保存可能 • 保存モデルは別タスクから再利用可能 • 保存タスクをcloneして再実行可能 • パラメータの変更と再実行 • まとめて評価指標を比較可能 Modelstore Pipelines Deploy
紹介 3/6 DataOps機能 DataOps Tuning Train Reports Modelstore Pipelines Deploy
Reproducibility Orchestrate • データセットの登録/アップロード • 変更時に元となるデータセットとの差分の表示 • データセットの継承履歴の可視化 from clearml import Dataset dataset = Dataset.create( dataset_project="dataset_examples", dataset_name="Training Dataset") child_dataset = Dataset.create( dataset_project="dataset_examples", dataset_name="Complete Dataset", parent_datasets=[dataset.id]) Modelstore Pipelines Deploy
紹介 4/6 Reports機能 DataOps Tuning Train Reports Modelstore Pipelines Deploy
Reproducibility Orchestrate • html, マークダウン形式のレポート作成 • 実験タスクの結果から図表が引用可能 • 共有リンク生成, pdf出力への対応
紹介 5/6 Pipelines機能 DataOps Tuning Train Reports Modelstore Pipelines Deploy
Reproducibility Orchestrate • 前処理/学習/評価など分割タスクをデコレータで装飾し、一連の処理として実行可能 • パイプライン自体のcloneとデータやパラメタを変更した実験の実行が可能 • 処理ごとに実行マシンを割り当て、個別にタスク実行が可能 from clearml.automation.controller import PipelineDecorator @PipelineDecorator.component(return_values=['data_frame'], cache=True) def step_one(pickle_data_url: str, extra: int = 43): import pickle import pandas as pd from clearml import StorageManager local_iris_pkl = StorageManager.get_local_copy(remote_url=pickle_data_url) with open(local_iris_pkl, 'rb') as f: iris = pickle.load(f) data_frame = pd.DataFrame(iris['data'], columns=iris['feature_names']) return data_frame
紹介 6/6 Deploy機能 DataOps Tuning Train Reports Modelstore Pipelines Deploy
Reproducibility Orchestrate 学習用マシン ClearMLサーバー 推論用コンテナ モデル学習 モデル保存 Serving Service 推論用エンドポイント HTTP Cliant POST JSON モデル同期 • 学習したモデルをdocker, Kubernetesを利用したスケーラブルな環境で展開 • 多様なモデルタイプのサポート(Scikit-learn,XGBoost,TensorFlow,PyTorch,ONNX) • カナリアデプロイ、モデル追加や置き換えなども柔軟に実行できる