Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習プロジェクトの進め方
Search
Hacarus Inc.
June 17, 2019
Technology
1
5.1k
機械学習プロジェクトの進め方
機械学習プロジェクトの進め方と各フェーズにおいてハカルスで行っていることについてのお話です。
Hacarus Inc.
June 17, 2019
Tweet
Share
More Decks by Hacarus Inc.
See All by Hacarus Inc.
GitLab CI/CD で C#/WPFアプリケーションのテストとインストーラーのビルド・デプロイを自動化する
hacarus
0
760
QA4AIに則ったMLOpsツールの活用
hacarus
0
590
0から協働ロボット外観検査システムを3ヵ月で具現化した軌跡
hacarus
0
130
ワンちゃんの健康を願う皆様に送る 犬心電図AI解析プロダクト紹介_AWS DevDay2022
hacarus
0
120
犬の心電AI解析プロダクト開発奮闘記 _クラウドからハード開発までてんこ盛り
hacarus
0
1.4k
ExplainableAIの概要とAmazon SageMaker Clarifyでの実装例
hacarus
0
690
AWS Step Functions を用いた非同期学習処理の例
hacarus
0
770
Dashでmyダッシュボードを作ろう ーpytrendsで見るコロナの感染拡大時期ー
hacarus
0
1k
Interpretable Machine Learning: モデル非依存な解釈手法の紹介
hacarus
0
830
Other Decks in Technology
See All in Technology
[2024最新版]AWS Control Towerを使ったセキュアなマルチアカウント環境の作り方
hiashisan
0
270
クラウド利用者の「責任」をどう果たす?AWSセキュリティ対策のススメ #AWSSummit
hiashisan
0
280
コンテナ・K8s研修 - 後半 Kubernetes 基礎&ハンズオン【MIXI 24新卒技術研修】
mixi_engineers
PRO
1
120
テストケースの自動生成に生成AIの導入を試みた話と生成AIによる今後の期待
shift_evolve
0
190
OSSコミットしてZennの課題を解決した話
dyoshikawa1993
0
150
コンテナ・K8s研修 - 前半 コンテナ基礎・ハンズオン【MIXI 24新卒技術研修】
mixi_engineers
PRO
0
170
AWSでRAGを作る法方
sonoda_mj
1
140
目標設定は好きですか? アジャイルとともに目標と向き合い続ける方法 / Do you like target Management?
kakehashi
10
3k
運用改善、不都合な真実 / 20240722-ssmjp-kaizen
opelab
17
8.2k
Git 研修 Basic【MIXI 24新卒技術研修】
mixi_engineers
PRO
0
310
AIエージェントを現場に導入する目線とは
masahiro_nishimi
1
1.5k
シフトレフトで挑む セキュリティの生産性向上
sekido
PRO
0
270
Featured
See All Featured
Web development in the modern age
philhawksworth
203
10k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
353
29k
Being A Developer After 40
akosma
72
580k
Designing on Purpose - Digital PM Summit 2013
jponch
113
6.6k
The Art of Programming - Codeland 2020
erikaheidi
48
13k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
35
6.3k
The World Runs on Bad Software
bkeepers
PRO
63
11k
What's in a price? How to price your products and services
michaelherold
239
11k
The Cost Of JavaScript in 2023
addyosmani
31
4.7k
4 Signs Your Business is Dying
shpigford
178
21k
Visualization
eitanlees
139
14k
Stop Working from a Prison Cell
hatefulcrawdad
266
20k
Transcript
ػցֶशϓϩδΣΫτ ͷਐΊํ MACHINE LEARNING Meetup KANSAI #5 2019-06-17 גࣜձࣾϋΧϧε ދथ
ࣗݾհ ދ थ גࣜձࣾϋΧϧε CDO (Chief Data Officer) 2011͔ΒػցֶशϓϩδΣΫτʹؔΘΓ࢝ΊΔ ͱͱΞϓϦέʔγϣϯΤϯδχΞɾΠϯϑϥΤϯδχΞ
ࠓ͓͍ͨ͜͠ͱ ػցֶशϓϩδΣΫτͷਐΊํͱ֤ϑΣʔζʹ͓͍ͯϋΧϧ εͰߦ͍ͬͯΔ͜ͱ
ػցֶशϓϩδΣΫτ֓؍ Business Understanding Data Understanding Data Preparation Modeling Evaluation Deployment
PoC
Business Understanding • తɾഎܠͷཧղ • ղ͖͘ͷఆٛ • ධՁࢦඪɾඪͷઃఆ • ϏδωεσβΠϯɾຊ൪ಋೖΠϝʔδ
• ϏδωεΠϯύΫτ • ֹۚࢉ
TIPS • ػցֶशͷಛੑΛސ٬ʹཧղ͍ͨͩ͘ • 100% ͷਫ਼ୡͰ͖ͳ͍ • ظίϯτϩʔϧ • υϝΠϯࣝͷ͋Δڠྗऀͷཁ
• ༻ޠͷ౷Ұ • ϢϏΩλεݴޠ • ͦͦػցֶशඞཁ? • ܾࡋऀͷίϯλΫτ • σʔλͷ༧උݕূ
Data Understanding • σʔλઃܭɾऩू • ɾΧςΰϦΧϧɾσʔλ • جຊ౷ܭྔ • ͷҙຯ
• ߲ؒͷؔ • ը૾ • ըૉͷώετάϥϜ • ࡱ૾ڥํ๏ɺ݅ͷ֬ೝ • ը૾ʹؔ͢Δఆੑతͳཧղ
TIPS • σʔλʹ͖߹͏ • ඦ݅͘Β͍ࢹ͢Δ • σʔλʹؔ͢Δײ͕ཆΘΕΔ • ͜ͷϑΣʔζऴྃ࣌ʹސ٬ͱଧͪ߹Θͤ͢Δ
͜Μͳ͜ͱ • ސ٬͕༩ͨ͠ϥϕϧ͕ؒҧ͍ͬͯΔ • ਓతϛε • ਓʹΑͬͯஅ͕ҟͳΔ • ͦͦඍົ
Data Preparation • ੳํࡦఆ (ɾΞϧΰϦζϜબఆ) • ֎Εܽଛͷѻ͍Λݕ౼ • σʔλΫϨϯδϯά •
ॏෳɾޡهɾදهΏΕͳͲͷमਖ਼ɾਖ਼نԽ • લॲཧ • σʔλ౷߹ • ϑΥʔϚοτ౷Ұ
TIPS • σΟϨΫτϦߏ • ࠶ݱੑΛ୲อ͢Δ data |—— external # ֎෦σʔλ
|—— interim # தؒՃσʔλ |—— processed # ՃࡁΈσʔλ |—- raw # ϩʔσʔλ Cookiecutter Data Science Λࢀߟʹఆٛ https://drivendata.github.io/cookiecutter-data-science/#directory-structure
Modeling • ΞϧΰϦζϜબఆ • ֶशɾσʔλੳ
TIPS • ϓϩδΣΫτ͝ͱʹ Docker ΠϝʔδΛ༻ҙ • σʔλಡΈࠐΈ༻ͷڞ༗ͷΫϥεؔΛ༻ҙ͢Δ • σʔλߏɾΫϥεઃܭͳΔ͘ૣΊʹऴ͓͑ͯ͘ •
୯७ͳσʔλूܭ૬ؔੳΛૄ͔ʹ͠ͳ͍ • ͘͢ԿࢼߦࡨޡͰ͖ΔΑ͏ʹ • ίʔυͷύϑΥʔϚϯε (࣮ߦ) ʹ͋ΔఔؾΛΔ • ίʔυϨϏϡʔΛ࣮ࢪ͢Δ • ϖΞϓϩάϥϛϯά༗ޮ • ܧଓϓϩδΣΫτॏཁͳίʔυʹ͍ͭͯϢχοτςετΛॻ͘
Evaluation • ධՁ • Cross Validation • Confusion Matrix •
ROC Curve, AUC • etc. • ߟ
• ਫ਼Λ 1%pt. ্͛Δ͜ͱ͕ͲΕ͚ͩͷϏδωεΠϯύΫ τ͕͋Δ͔
Deployment • γεςϜઃܭ • Ϟσϧਫ਼ͷϞχλϦϯά • Ϟσϧߋ৽ํ๏ͷઃܭ • Ϟσϧͷόʔδϣϯཧ •
ಋೖ • ӡ༻
TIPS • ΞϓϦέʔγϣϯΤϯδχΞ༻ͷυΩϡϝϯτ༻ҙ • API • جຊతͳར༻ํ๏ • ݱʹԿʹཧղͯ͠Β͏͔ •
ݱʹཧղͰ͖Δݴ༿Ͱઆ໌ • ݱͷ࣮ଶΛཧղ͢Δ
Q&A