Introduction to Practical Machine Learning

Introduction to Practical Machine Learning Asei Sugiyama

⽬的機械学習を実⽤するにあたり必要になった、機械学習アルゴリズム以外の知識を共有します

要旨機械学習アルゴリズム以外にも Human in the Loop なサービス設計, Experimental Design (実験デザイン),
Data Processing, Data Management に関するスキルが必要必然的にチーム戦になるものの ML は複雑なため DevOps との対⽴が⽣じる、MLOps はこの対⽴を解消する試みの総称機械学習にいきなり⾶びつくのではなく、そこまでの段階を計画⼈から継続的にフィードバックを受けられる Human in the Loop な仕組みを構築することが重要

TOC Data Science for Software Engineers <- Introduction to MLOps
Human in the Loop Recap Appendix

Data Science for Software Engineers データを⽤いて取り組むタスクには、記述・予測・因果推論がある機械学習は、収集されたデータセットをもとにした観察研究と位置づけられる集めたデータの品質はデータの収集・集計で決まる交絡の制御は実験デザインで⾏う
介⼊効果の推定には A/B テスト (ランダム化⽐較試験) が必要

TOC Types of Machine Learning Tasks Types of Data Science
Tasks Types of Studies Clinical Research vs Social Epidemiology Hard Problems of Data Science Recap

Types of Machine Learning Tasks Types 教師あり教師なし強化学習コードだけではなく、コードとデータが振る
舞いを決める有賀康顕, 中⼭⼼太, ⻄林孝著「仕事ではじめる機械学習第2版」オライリー・ジャパン 2021年 https://www.oreilly.co.jp/books/9784873119472/

Types of Data Science Tasks Types 記述予測因果推論画像認識は記述
機械翻訳は予測 + 探索マーケティングの効果の推定は因果推論因果推論はデータだけでは困難 (後述) Miguel A. Hernán, John Hsu & Brian Healy (2019) A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, CHANCE, 321, 42-49, DOI: 10.1080/09332480.2019.1579578

Types of Studies (1/3) 観察研究記述研究分析研究横断研究縦断研究介⼊研究
系統的メタアナリシス佐々⽊敏著 2018年度夏学期「疫学研究と実践」第1回講義資料 p.8 http://www.nutrepi.m.u-tokyo.ac.jp/lecture/180406SPH.pdf

Types of Studies (2/3) 分析研究: ⼤規模な調査を⾏ってデータを収集し、集計を⾏って変化を追跡機械学習モデルの訓練は基本的に観察研究
オフラインのデータセットを⽤いる場合、⾏っているのは分析研究佐々⽊敏著 2018年度夏学期「疫学研究と実践」第1回講義資料 p.8 http://www.nutrepi.m.u-tokyo.ac.jp/lecture/180406SPH.pdf

Types of Studies (3/3) 機械学習の効果測定には、介⼊研究 (A/B テスト) が必要
機械学習は関連・原因の仮説⽴案を楽にするもの機械学習の効果は未知、あくまでも予測 (Uplift modeling でも同じ) 佐々⽊敏著 2018年度夏学期「疫学研究と実践」第1回講義資料 p.8 http://www.nutrepi.m.u-tokyo.ac.jp/lecture/180406SPH.pdf

相関 ≠ 因果⼈出が多いと列⾞の本数は多い⼈出が少ないと列⾞の本数は少ない列⾞の本数を減らしても⼈出は減らない
「【速報】減便の⼭⼿線などあすは通常ダイヤに JR東⽇本などの混雑を受けて（NHKニュース）」 - Twitter https://twitter.com/livedoornews/status/1390167796340776 s=20

Clinical Research vs Social Epidemiology (1/3) 疫学の次の 2 つの分野を取り上げる臨床試験
特定の疾患をもつ患者に対する特定の治療効果の推定狭い対象領域であっても社会的な意義につながることがある公衆栄養学⽣活習慣や⾷⽂化の健康に及ぼす影響を知る広く改善を⾏うことが社会的な意義につながる重症患者に対する効果的な栄養補給はここでは臨床試験に含める

Clinical Research vs Social Epidemiology (2/3) 公衆栄養学のほうがはっきりとした結論になりにくい「重度の糖尿病患者」よりも「⽇々の⽣活を健康的に過ごしている成⼈(20
歳〜70 歳)」のほうが多様多様な患者に対する介⼊ははっきりとした効果が出にくい対照群の設定 (着⽬する集団の定義) が重要佐々⽊敏著「佐々⽊敏の栄養データはこう読む！第２版」⼥⼦栄養⼤学出版部 2020年 https://eiyo21.com/book/9784789554596/

Clinical Research vs Social Epidemiology (3/3) ⼀定期間経過後の⽣存/死亡よりも、⼀⽇の総摂取塩分のほうが測定困難前者は公的に収集する仕組みがある、後者は 2
⽇間 (24h x 2) の尿中⾷塩量から測定⼀⼈ひとりに「丁寧にお願い」するデータの品質向上が必要データの測定⽅法に注意が必要佐々⽊敏著「佐々⽊敏の栄養データはこう読む！第２版」⼥⼦栄養⼤学出版部 2020年 https://eiyo21.com/book/9784789554596/

Hard Problems of Data Science 交絡因果推論の根本問題 image from Why
Metaflow - Metaflow

交絡集めたデータに交絡がないことは保証できない後から調整する場合でも、収集していない特徴に基づく調整はできない交絡の制御は集計対象と集計⽅法の設計が必要京都⼤学⼤学院医学研究科
聴講コース臨床研究者のための⽣物統計学「交絡とその調整」佐藤俊哉(医学研究科教授) - YouTube https://youtu.be/ybdkQFEdCPM

因果推論の根本問題反事実そのものは観測することができないデータから介⼊効果の推定するためには検証困難な仮定が必要介⼊効果の推定にはランダム化⽐較試験 (A/B テスト)
が必要因果探索⼊⾨ (2/4). 清⽔昌平 (滋賀⼤学データサイエンス学系) - YouTube https://youtu.be/qP2hgkd5ohk

Recap データを⽤いて取り組むタスクには、記述・予測・因果推論がある機械学習は、収集されたデータセットをもとにした観察研究と位置づけられる集めたデータの品質はデータの収集・集計で決まる交絡の制御は実験デザインで⾏う介⼊効果の推定には A/B テスト (ランダム化⽐較試験)
が必要

TOC Data Science for Software Engineers Introduction to MLOps <-
Human in the Loop Recap Appendix

Introduction to MLOps MLOps: ML と DevOps の対⽴の解消バージョン管理の対象はコード +
データ (IaC + データ管理) DevOps に加えて次の 4 つの分野のスキルが必要 Human in the Loop なサービス設計 Experimental Design Data Management Data Processing

ToC What is the MLOps? Why MLOps? MLOps Team Roles
and Responsibilities Additional Skill sets for MLOps

What is the MLOps? Google Cloud のドキュメントより引⽤ MLOps は、ML システム開発（Dev）と
ML システムオペレーション（Ops）の統合を⽬的とする ML エンジニアリングの⽂化と⼿法です。 MLOps を実践すると、統合、テスト、リリース、デプロイ、インフラストラクチャ管理など、ML システム構築のすべてのステップで⾃動化とモニタリングを推進できます。ざっくりと DevOps + ML なものの、CI/CD に Continuous Training が加わる点は異なる MLOps: 機械学習における継続的デリバリーと⾃動化のパイプライン - Google Cloud https://cloud.google.com/architecture/mlops-continuous-delivery-and- automation-pipelines-in-machine-learning

Continuous Training 機械学習モデルの訓練・デプロイを⾃動化コードだけでなくデータのバージョン管理が必要時系列データではデプロイの基準を決めやすい (とりあ
えず最新が可能) MLOps: 機械学習における継続的デリバリーと⾃動化のパイプライン - Google Cloud https://cloud.google.com/architecture/mlops-continuous-delivery- and-automation-pipelines-in-machine-learning

Why MLOps? Why DevOps? Machine Learning vs DevOps Machine Learning
vs Product Management MLOps: Defeat conflicts to provide values

Why DevOps? (1/2) Dev vs Ops Dev: 顧客に新しい価値を早く提供したい、多少不安定になるかもしれないが運⽤が頑張れば良い
Ops: 顧客に安定的に価値を提供したい、新機能の追加で不安定になることは受け⼊れられない 10+ Deploys Per Day: Dev and Ops Cooperation at Flickr - Slideshare https://www.slideshare.net/jallspaw/10-deploys-per-day-dev-and-ops-cooperation-at-flickr

Why DevOps? (2/2) Dev vs Ops から Dev & Ops
に移⾏しようという提案 (2008) 「顧客に価値をすばやく安定的に提供しよう」という提案この提案に基づくのが DevOps DevOps: Dev と Ops の協調 10+ Deploys Per Day: Dev and Ops Cooperation at Flickr - Slideshare https://www.slideshare.net/jallspaw/10-deploys-per-day-dev-and-ops-cooperation-at-flickr

Machine Learning vs DevOps (1/2) 機械学習はシステムに新たな複雑さをもたらす Sculley, D. and Holt,
Gary and Golovin, Daniel and Davydov, Eugene and Phillips, Todd and Ebner, Dietmar and Chaudhary, Vinay and Young, Michael and Crespo, Jean-Fran\c{c}ois and Dennison, Dan (2015) Hidden Technical Debt in Machine Learning Systems, Advances in Neural Information Processing Systems 28 (NIPS 2015) https://proceedings.neurips.cc/paper/2015/hash/86df7dcfd896fcaf2674f757a2463eba-Abstract.html

Machine Learning vs DevOps (2/2) データサイエンティストと開発者の間の新たな対⽴ ML: 顧客にデータを使って価値を提供したい、システムが複雑になるのは仕⽅がない DevOps:
顧客にシンプルな⽅法で価値を提供したい、システムの複雑化はコストが嵩むので避けたい究極的には両者の⽬的は同じなので対⽴は解消できる「顧客にデータを使って安定的に素早く価値を提供したい」というように対⽴を解消する

Machine Learning vs Product Management (1/2) Product Manager (PdM) との間にも価値観の
対⽴がある PdM: ユーザーに素早く価値を提供し、プロダクトを徐々に作り込みながらデータドリブンですすめる ML: ⼗分な質のデータがすでにあり、そこから機械学習により価値を提供する Melissa Perri 著, 吉⽻⿓太郎訳「プロダクトマネジメント―― ビルドトラップを避け顧客に価値を届ける」オライリー・ジャパン 2020年 https://www.oreilly.co.jp/books/9784873119250/

Machine Learning vs Product Management (2/2) データがなくても機械学習を適⽤するワークフローが⽣み出す価値の検証は可能 Wizard-of-Oz
(オズの魔法使い) サービスを成⻑させてスケールメリットをデータで強化する Peter Wang, Srinath Sibi, Brian Mok, and Wendy Ju. 2017. Marionette: Enabling On-Road Wizard-of-Oz Autonomous Driving Studies. In Proceedings of the 2017 ACM/IEEE International Conference on Human-Robot Interaction (HRI '17). Association for Computing Machinery, New York, NY, USA, 234–243. DOI:https://doi.org/10.1145/2909824.3020256

MLOps: Defeat conflicts to provide values MLOps は ML とソフトウェア開発の間の対⽴を解消する取り組み
具体的なプラクティスはいくつか出てきたものの、プラクティスに従うことではなく⾃分たちの問題解決が重要 (⾃分たちが考える MLOps で良い) ⾔い換えると、機械学習により顧客に価値提供ができるチーム作りだと⾔える

ものづくりは⼈づくり⾹川編集⻑トヨタ⽣産⽅式取材フル (⽣産量を「100倍」にしたトヨタ⽣産⽅式の秘密) | トヨタイムズ - YouTube https://youtu.be/GGJt8VUu4cc

MLOps Team Roles and Responsibilities Product Manager (Product Owner) 機械学習システムで⽣み出す価値について責任を追う
Software Engineer 機械学習システムが動作することについて責任を追う Data Engineer, DevOps Engineer, Application Engineer を含む Data Scientist 機械学習システムの動作状況について、意思決定に資する情報提供へ責任を追う

Skills for MLOps DevOps Skills Product Management Software Development +
IoC, CI/CD, Monitoring, etc. Data Science Human in the loop なエコシステムの設計 Experimental Design Data Management Data Processing

Human in the loop システムの中⼼に⼈間を据えるシステム設計システムのコンポーネントの 1 つとして⼈を置く
本資料での以降の中⼼的な話題 Robert (Munro) Monarch 著, 「Human-in-the-Loop Machine Learning」 MANNING PUBLICATIONS https://www.manning.com/books/human-in-the- loop-machine-learning 堀⽥創, 尾原和啓著「ダブルハーベスト」ダイヤモンド社 2021年 https://www.diamond.co.jp/book/9784478111017.html

Experimental Design データの利⽤前に次を決めておくことで、データ分析の妥当性を向上させる技術収集対象と⽐較対象収集⽅法集計⽅法と分析⽅法さまざまな知識と経験の集合体で、上にとどまらない
G. D. ラクストン, N. コルグレイヴ著⿇⽣⼀枝, 南條郁⼦訳「⽣命科学の実験デザイン［第4 版］」名古屋⼤学出版会 2019年 https://www.unp.or.jp/ISBN/ISBN978-4-8158-0950-8.html

Data Management データを資産と捉え、体系的に価値を引き出すための⼿法狭義では⼊⼒されたデータを解析できる状態にするまでの品質管理ゆずたそ, はせりょ著「データマネジメントが30分でわかる本」オンデマンド 2020年
https://www.amazon.co.jp/dp/B087R6P8NZ/

Recap MLOps: ML と DevOps の対⽴の解消バージョン管理の対象はコード + データ (IaC
+ データ管理) DevOps に加えて次の 4 つの分野のスキルが必要 Human in the Loop なサービス設計 Experimental Design Data Management Data Processing

TOC Data Science for Software Engineers Introduction to MLOps Human
in the Loop <- Recap Appendix

Human in the Loop Human in the Loop は⼈間をシステムのコンポーネントの 1
つとして配置し、フィードバックループを作ることで継続的に品質の⾼いデータが⼊⼿できるようにするサービス設計パターン背景にあるのはスケールメリット、スケールしない⼈間というリソースを機械学習の⼒でスケールさせるユーザーがサービスを使っていると⾃然に学習データを⼊⼒するような UX デザインが必要いきなり機械学習から始めるのではなく、ステップを踏んでサービスを成⻑させることが⼤事

TOC Background Purpose of this section Human in the Loop
Case Study Technologies behind the Human in the Loop Considerations Recommendations Recap

Background 機械学習は実世界への適⽤が難しいことが知られている経験上うまくいった機械学習の活⽤⽅法に、Active Learning を参考にしたワークフローがある mercari と cookpad でも類似のパターンを⽤いており再現性がある
Google は How Google Does Machine Learning で Human in the Loop とこれを呼び、活⽤を推奨している最近では仕事ではじめる機械学習第 2 版や機械学習による実⽤アプリケーション構築、ダブルハーベストといった書籍でも触れらており、重要性が増している

Purpose of This Section 機械学習のサービス設計パターンの 1 つである Human in the
Loop を知ることで、機械学習サービスの⽴ち上げに関する検討を開始できるようにする

Human in the Loop (1/2) ⼈間は AI のサポートによって潜在能⼒を開花させ、AI は⼈間の教育によってさらに賢くなる。(中略)このような⼈間と
AI のコラボレーションは「ヒューマン・イン・ザ・ループ(HITLHuman-in-the-Loop)」と呼ばれ、単なる「⾃動化(Automation)」とは区別されている。技術者向けの記述ではないため割り引いて読む必要があるもの、コンセプトは説明されている堀⽥創, 尾原和啓著「ダブルハーベスト」ダイヤモンド社 2021年ヒューマン・イン・ザ・ループのアプローチ https://www.diamond.co.jp/book/9784478111017.html

Human in the Loop (2/2) データからモデルを作成モデルのアウトプットを⼈が修正修正結果をデータ
セットに蓄積し、再学習堀⽥創, 尾原和啓著「ダブルハーベスト」ダイヤモンド社 2021年ヒューマン・イン・ザ・ループのアプローチ https://www.diamond.co.jp/book/9784478111017.html

Case Study 事例 1. mercari 事例 2. cookpad 事例 3.
TESLA 事例 4. Google 翻訳

事例 1. mercari 違反出品検知システムで Human in the Loop を利⽤違反出品に該当するアイテ
ムはさまざまな事情で更新される (例: マスク) ⼈間の判断をもとにデータセットを更新し、再学習させている機械学習とHuman-in-the-Loopで優勝する違反検知の話 - メルカリエンジニアリング https://engineering.mercari.com/blog/entry/2020-03-25-180000/

事例 2. cookpad (1/2) 問い合わせ窓⼝での利⽤ユーザーからの問い合わせをサポートスタッフが⼿動でカテゴリーに分類カテゴリーは 100
種類以上機械学習を⽤いてユーザーのご意⾒分類業務を効率化した話 - クックパッド開発者ブログ https://techlife.cookpad.com/entry/2018/08/08/170000

事例 2. cookpad (2/2) カテゴリーを推薦⼈⼿で選択、結果を保存再学習してモデルを更新機械学習を⽤いてユーザーのご意⾒分類業務を効率化した話 - クックパッド開発者ブログ
https://techlife.cookpad.com/entry/2018/08/08/170000

事例 3. TESLA ⾃動運転判定結果と運転操作が⽭盾した画像を⾃動的に収集学習データとテストデータ
に追加 Tesla Autonomy Day - YouTube https://youtu.be/Ucp0TTmvqOE?t=7714

事例 4. Google 翻訳ユーザーが翻訳結果にフィードバックを加えられるフィードバックした結果は翻訳結果の向上に⽤いられる (おそらく直接ではない)

Technologies behind the Human in the Loop Product Management UX
Design Data Management Algorithm

Product Management (1/2) いきなり機械学習を前提にするのは典型的な悪⼿ (Rule #1) プロダクトの状態を監視できるような指標をまず設計し監視できるようにする
(Rule #2) ヒューリスティックが複雑になり、⼿に負えなくなってきたら機械学習を⼊れる (Rule #3) Rules of Machine Learning - Google Developers https://developers.google.com/machine- learning/guides/rules-of- ml/#rule_1_donʼt_be_afraid_to_launch_a_product_without_machine_learning

ML pitfalls データがないのに検討使えるデータがあると思い込む⼈を配置し忘れる etc...
機械学習の秘訣 (How Google Does Machin Coursera https://coursera.org/share/f8057e32329c

Product Management (2/2) データ活⽤の Step . ⼩さく始める . 標準化 .
システム化 . データ分析 . 機械学習機械学習とビジネスプロセス (How Google Does Machine Learning ⽇本語版) - Coursera https://www.coursera.org/learn/google-machine-learning- jp/lecture/G8qKf/ji-jie-xue-xi-tobizinesu-purosesu

プロダクトを成⻑させる、道を踏み外さない各フェーズを掘り下げる (How Google Does Machine Learning ⽇本語版) - Coursera
https://coursera.org/share/faf9215a37a5a12c0e3653225f7020d6

UX Design (1/2) Human interface guideline by Apple Machine Learning
の中で Explicit Feedback と Implicit Feedback について触れられている右はブラウザでの Explicit なフィードバックの例 Bad だけをフィードバックの対象として Bad でなければ Good とみなす点が特徴的

UX Design (2/2) People + AI Guidebook by Google (PAIR)
Data Collection + Evaluation でデータの収集、Feedback + Controlでフィードバックについて右図で述べられているユーザーへのお礼の表⽰⽅法は経験上かなり重要 Feedback + Control - People + AI Guidebook https://pair.withgoogle.com/chapter/feedback-controls/#section2

Data Management (1/2) データ品質の管理が必要疫学調査の取り組みが参考になる⼿順書の配備⼊⼒値のバリデーションサンプリングによるダブルチェック
京都⼤学⼤学院医学研究科聴講コース臨床研究者のための⽣物統計学「データマネジメントとは」 - YouTube https://youtu.be/bDLgduWWpms

Data Management (2/2) データのバージョン管理が必要モデルを更新する場合、各時点でのデータがないとモデルの不具合の再現ができなくなる各時点での評価⽤データを残さないとモデルが改善されたのかどうか判断できなくなるリグレッションテストを⾏う必要があることに注意、評価データの更新ルールも検討する

Algorithm (1/3) Human in the loop はデータの探索、評価、再学習と定式化できるこの枠組は強化学習や
Bandit アルゴリズムで取り組まれるものに同⼀ Robert (Munro) Monarch 著, 「Human-in-the-Loop Machine Learning」 MANNING PUBLICATIONS https://www.manning.com/books/human-in-the- loop-machine-learning

Algorithm (2/3) アルゴリズムは「いかに効率的にアノテーションするか」に注⼒しているいかに継続的に⾼品質なデータを得るワークフローを構築するかに注⼒するほうが(経験上)良い Robert
(Munro) Monarch 著, 「Human-in-the-Loop Machine Learning」 MANNING PUBLICATIONS https://www.manning.com/books/human-in-the- loop-machine-learning

Algorithm (3/3) アノテーターが回答しやすいように問題を置き換えることも⼤事回帰 → ランキング分類 →
距離学習 (triplet- loss) Robert (Munro) Monarch 著, 「Human-in-the-Loop Machine Learning」 MANNING PUBLICATIONS https://www.manning.com/books/human-in-the- loop-machine-learning

Considerations Echo chamber & Filter bubble Training / Serving Skew
Fairness

Echo chamber & Filter bubble (1/2) エコーチェンバーソーシャルメディアを利⽤する際、⾃分と似た興味関⼼をもつユーザーをフォローする結果、意⾒を
SNS で発信すると⾃分と似た意⾒が返ってくるという状況を、閉じた⼩部屋で⾳が反響する物理現象にたとえたものインターネット上での情報流通の特徴と⾔われているもの - 令和元年版情報通信⽩書 https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r01/html/nd114210.html

Echo chamber & Filter bubble (2/2) フィルターバブルアルゴリズムがネット利⽤者個⼈の検索履歴やクリック履歴を分析し学習することで、個々のユーザーにとっては望むと望まざるとにかかわらず⾒たい情報が優先的に表⽰され、利⽤者の観点に合わない情報からは
隔離され、⾃⾝の考え⽅や価値観の「バブル（泡）」の中に孤⽴するという情報環境インターネット上での情報流通の特徴と⾔われているもの - 令和元年版情報通信⽩書 https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r01/html/nd114210.html

Training / Serving Skew Type 説明 Schema Skew 訓練⽤データと本番⽤データのスキーマが異なる Feature
Skew 特徴量の値が訓練時と本番環境とで異なる Distribution Skew 特徴量の分布が本番環境のデータの分布と著しく異なる Scoring/Serving Skew スコア付されたデータの⼀部しか本番環境に提供されずラベル付けされない A brief introduction to Training/Serving Skew - zenn https://zenn.dev/asei/articles/e593da33c53ee4

Scoring/Serving Skew トップ 10 件の広告を提⽰するような広告システムを考えます。これらの 10 件の広告のうち、1 つのみがユーザーにクリックされる可能性があります。10
件の提⽰された標本データが次の⽇の訓練データに使われます。1 件はポジティブで、9 件はネガティブです。⼀⽅、本番環境ではそのモデルは 100 件の広告をスコア付するために使われます。他の 90 件の提⽰されなかった広告は、暗黙的に訓練データから取り除かれます。これは、下位にランク付けされたものについて誤予測するように、暗黙的なフィードバックループを引き起こします。下位にランク付けされたデータは訓練データに現れないからです。 A brief introduction to Training/Serving Skew - zenn https://zenn.dev/asei/articles/e593da33c53ee4

Fairness (1/2) データにバイアスがあるとモデルの出⼒が不公平になる右はデータが⽩⼈に偏っていた例 Apple Card の与信枠の性差も話題 @tg_bomze https://t.co/LG2cimkCFm
- Twitter https://twitter.com/Chicken3gg/status/1274314622447820801?s=20

Fairness (2/2) 評価指標を⼯夫することによる軽減の取り組みユーザー群間での出⼒に制約を設ける例 (右図) Fairness-Aware Ranking in
Search & Recommendation Systems with Application to LinkedIn Talent Search Fairness Indicators for TensorFlow (TF Dev Summit '20) - YouTube https://youtu.be/JF4TbOw_32k

Recommendations 予備実験アノテーターの訓練計測 & モニタリング

予備実験実験を⼩規模に⾏い、求める結果が得られそうか⾒込みを⽴てる実験デザインで定めた⼿順にしたがってデータを収集、集計して実験デザインのテストを⾏うデータが集計できないことに後で気がつくと取り返しがつかない Human in the Loop なシステムで改善が⾒られるか⾃分たちで⼀度試し
てみるオズの魔法使いパターンを⽤いて、ユーザーからフィードバックが得られるか試してみる

アノテーターの訓練エンドユーザーからデータを得られるのが⼀番そうでない場合、⼈⼿でアノテーションが必要チームを⽴ち上げてデータを蓄積できるようになるまでには数週間かかる Robert (Munro)
Monarch 著, 「Human-in-the-Loop Machine Learning」 MANNING PUBLICATIONS https://www.manning.com/books/human-in-the- loop-machine-learning

計測 & モニタリングビジネス指標とシステム運⽤指標のモニタリング機械学習システムは機械学習以外の箇所で壊れる体験談: ボットが変なことを⾔うという問い合わせ
タイムアウトのエラーメッセージが表⽰されていた Daniel Papasian and Todd Underwood, How ML Breaks: A Decade of Outages for One Large ML Pipeline, USENIX Association 2020 https://www.usenix.org/conference/opml20/presentation/papasian

Recap Human in the Loop は⼈間をシステムのコンポーネントの 1 つとして配置し、フィードバックループを作ることで継続的に品質の⾼いデータが⼊⼿できるようにするサービス設計パターン
背景にあるのはスケールメリット、スケールしない⼈間というリソースを機械学習の⼒でスケールさせるユーザーがサービスを使っていると⾃然に学習データを⼊⼒するような UX デザインが必要いきなり機械学習から始めるのではなく、ステップを踏んでサービスを成⻑させることが⼤事

TOC Data Science for Software Engineers Introduction to MLOps Human
in the Loop Recap <- Appendix

Recap 機械学習アルゴリズム以外にも Human in the Loop なサービス設計, Experimental Design (実験デザイン),
Data Processing, Data Management に関するスキルが必要必然的にチーム戦になるものの ML は複雑なため DevOps との対⽴が⽣じる、MLOps はこの対⽴を解消する試みの総称機械学習にいきなり⾶びつくのではなく、そこまでの段階を計画⼈から継続的にフィードバックを受けられる Human in the Loop な仕組みを構築することが重要

Appendix: Skills of MLOps Team

Appendix: MLOps Skills of Product Manager Product Management Data Science
(Fundamental) Human in the loop なエコシステムの設計

Appendix: MLOps Skills of Software Engineer IoC, CI/CD, Software Development
Data Science (Fundamental) Data Management Data Processing

Appendix: MLOps Skills of Data Scientist Applied Data Science Data
Processing Experimental Design IoC, CI/CD, Software Development (Fundamental)

Appendix: Types of Data Scientist (1/2) Analyst, Consultant データ分析で⽣きてきた⼈たち Excel
と PowerPoint のエキスパートで、経営的な意思決定に強い Software Engineer ソフトウェア開発をやってたらいつの間にかデータサイエンスをやることになった⼈たち機械学習システムの開発に強みを持つ

Appendix: Types of Data Scientist (2/2) Kaggler Kaggle から⼊ってきた⼈たちどちらかというと
Product Manager に向いているものの、⼈による Scientist 研究していたら産業側に流れてきた⼈たち特殊スキルに特化しているため、何に向くかは⼈による

Appendix: Data Scientist in Spotify データサイエンスだけではなく次のスキルも要求されている Experimental Design
Product management Data Processing Jonathan Rasmusson 著, 島⽥浩⼆, ⾓⾕信太郎訳「ユニコーン企業のひみつ」オライリー・ジャパン 2021年 https://www.oreilly.co.jp/books/9784873119465/

Introduction to Practical Machine Learning

Introduction to Practical Machine Learning

More Decks by Asei Sugiyama

Other Decks in Technology

Featured

Transcript