Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MLOps初心者がApache Airflowを触る / Apache Airflow Int...
Search
Henry Cui
May 27, 2023
Programming
0
230
MLOps初心者がApache Airflowを触る / Apache Airflow Introduction for an MLOps Beginner
Henry Cui
May 27, 2023
Tweet
Share
More Decks by Henry Cui
See All by Henry Cui
プロダクション言語モデルの情報を盗む攻撃 / Stealing Part of a Production Language Model
zchenry
0
57
Direct Preference Optimization
zchenry
0
260
Diffusion Model with Perceptual Loss
zchenry
0
200
レンズの下のLLM / LLM under the Lens
zchenry
0
140
Go with the Prompt Flow
zchenry
0
130
Mojo Dojo
zchenry
1
170
ことのはの力で画像の異常検知 / Anomaly Detection by Language
zchenry
0
320
驚愕の事実!LangChainが抱える問題 / Problems of LangChain
zchenry
0
160
MLOps初心者がMLflowを触る / MLflow Brief Introduction
zchenry
0
77
Other Decks in Programming
See All in Programming
LangChainでWebサイトの内容取得やGitHubソースコード取得
shukob
0
150
マルチモジュールにおけるテスト最適化
fxwx23
0
190
Desafios e Lições Aprendidas na Migração de Monólitos para Microsserviços em Java
jessilyneh
2
140
全部見せます! クラシルリワードのSwiftTesting移行プロジェクト
uetyo
0
180
GoのIteratorに詳しくなってしまう
inatonix
1
200
LR で JSON パーサーを作る / Coding LR JSON Parser
junk0612
2
180
Some more adventure of Happy Eyeballs
coe401_
2
170
僕が思い描くTypeScriptの未来を勝手に先取りする
yukukotani
9
2.3k
The Shape of a Service Object
inem
0
440
実践!難読化ガイド
mitchan
0
110
Method Swizzlingを行うライブラリにおけるマルチモジュール設計
yoshikma
0
110
2024 컴포즈 정원사
jisungbin
0
150
Featured
See All Featured
Done Done
chrislema
180
16k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
26
2k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
27
8.9k
The Cost Of JavaScript in 2023
addyosmani
41
5.2k
The Illustrated Children's Guide to Kubernetes
chrisshort
47
48k
Bootstrapping a Software Product
garrettdimon
PRO
304
110k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
23
1.7k
4 Signs Your Business is Dying
shpigford
179
21k
The Brand Is Dead. Long Live the Brand.
mthomps
53
37k
Thoughts on Productivity
jonyablonski
66
4.2k
Navigating Team Friction
lara
183
13k
The Mythical Team-Month
searls
218
43k
Transcript
MLOps初心者がApache Airflowを触る 機械学習の社会実装勉強会第23回 Henry 2023/5/27
内容 ▪ Apache Airflowについて ▪ Dockerを利用した起動方法 ▪ Taskflow API 2
Apache Airflowについて ▪ タスクの自動実行をやってくれるライブラリ • Crontabのような自動実行 • タスク間の依存関係 • Pythonのライブラリ
• ログ・可視化が完備 • 競合の中に一番 Github Star数が多い(弊者調べ) • その分大きなコミュニティに使われている ▪ 向かないケースもある • ストリーミングデータに向いてない • 可視化あるがコード書きたくない人に向いてない 3
Dockerを利用した起動方法 ▪ docker-compose.ymlを入手 • 自分は https://airflow.apache.org/docs/apache-airflow/2.6.1/docker-compose.yaml • Dockerfileが不要なのはymlファイルの中で公開コンテナを使う ▪ docker
compose up airflow-init で初期化 ▪ docker compose up で諸々のコンポーネントを起動 4
Apache Airflow の諸々の概念 ▪ 全体のアーキテクチャ ▪ 初心者が扱う概念 • DAG:有向非巡回グラフ ▪
一つのまとまりのジョブ、タスク間の依存関係が定義される • タスク:実行したいジョブの最小単位、DAGの要素 5
Taskflow API ▪ 今までより扱いやすくなったDAG定義の書き方 ▪ 詳しくは画面共有しながら説明する • https://airflow.apache.org/docs/apache-airflow/stable/tutorial/taskfl ow.html も参照
• Task decoratorのパラメータは https://github.com/apache/airflow/blob/2.4.0/airflow/decorators/ba se.py#L546-L557 参照 ▪ カスタムDAGファイルも認識できる • 今のところairflowサーバーの再起動が必要 6