Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習プロジェクトの進め方
Search
Hacarus Inc.
June 17, 2019
Technology
1
5.5k
機械学習プロジェクトの進め方
機械学習プロジェクトの進め方と各フェーズにおいてハカルスで行っていることについてのお話です。
Hacarus Inc.
June 17, 2019
Tweet
Share
More Decks by Hacarus Inc.
See All by Hacarus Inc.
GitLab CI/CD で C#/WPFアプリケーションのテストとインストーラーのビルド・デプロイを自動化する
hacarus
0
1.2k
QA4AIに則ったMLOpsツールの活用
hacarus
0
690
0から協働ロボット外観検査システムを3ヵ月で具現化した軌跡
hacarus
0
250
ワンちゃんの健康を願う皆様に送る 犬心電図AI解析プロダクト紹介_AWS DevDay2022
hacarus
0
190
犬の心電AI解析プロダクト開発奮闘記 _クラウドからハード開発までてんこ盛り
hacarus
0
1.8k
ExplainableAIの概要とAmazon SageMaker Clarifyでの実装例
hacarus
0
1k
AWS Step Functions を用いた非同期学習処理の例
hacarus
0
1.3k
Dashでmyダッシュボードを作ろう ーpytrendsで見るコロナの感染拡大時期ー
hacarus
0
1.4k
Interpretable Machine Learning: モデル非依存な解釈手法の紹介
hacarus
0
1.1k
Other Decks in Technology
See All in Technology
AIの個性を理解し、指揮する
shoota
3
630
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
2
270
ソフトウェア品質を支える テストとレビュー再考 / 吉澤 智美さん
findy_eventslides
0
100
なぜ新機能リリース翌日にモニタリング可能なのか? 〜リードタイム短縮とリソース問題を「自走」で改善した話〜 / data_summit_findy_Session_2
sansan_randd
1
120
短期間でRAGシステムを実現 お客様と歩んだ生成AI内製化への道のり
taka0709
1
190
datadog-incident-management-intro
tetsuya28
0
120
DMARCは導入したんだけど・・・現場のつぶやき 〜 BIMI?何それ美味しいの?
hirachan
1
160
OPENLOGI Company Profile for engineer
hr01
1
46k
AIでデータ活用を加速させる取り組み / Leveraging AI to accelerate data utilization
okiyuki99
6
1.8k
激動の2025年、Modern Data Stackの最新技術動向
sagara
0
720
設計に疎いエンジニアでも始めやすいアーキテクチャドキュメント
phaya72
27
18k
GTC 2025 : 가속되고 있는 미래
inureyes
PRO
0
150
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Keith and Marios Guide to Fast Websites
keithpitt
412
23k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
It's Worth the Effort
3n
187
28k
Why Our Code Smells
bkeepers
PRO
340
57k
Music & Morning Musume
bryan
46
6.9k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
116
20k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Producing Creativity
orderedlist
PRO
348
40k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Transcript
ػցֶशϓϩδΣΫτ ͷਐΊํ MACHINE LEARNING Meetup KANSAI #5 2019-06-17 גࣜձࣾϋΧϧε ދथ
ࣗݾհ ދ थ גࣜձࣾϋΧϧε CDO (Chief Data Officer) 2011͔ΒػցֶशϓϩδΣΫτʹؔΘΓ࢝ΊΔ ͱͱΞϓϦέʔγϣϯΤϯδχΞɾΠϯϑϥΤϯδχΞ
ࠓ͓͍ͨ͜͠ͱ ػցֶशϓϩδΣΫτͷਐΊํͱ֤ϑΣʔζʹ͓͍ͯϋΧϧ εͰߦ͍ͬͯΔ͜ͱ
ػցֶशϓϩδΣΫτ֓؍ Business Understanding Data Understanding Data Preparation Modeling Evaluation Deployment
PoC
Business Understanding • తɾഎܠͷཧղ • ղ͖͘ͷఆٛ • ධՁࢦඪɾඪͷઃఆ • ϏδωεσβΠϯɾຊ൪ಋೖΠϝʔδ
• ϏδωεΠϯύΫτ • ֹۚࢉ
TIPS • ػցֶशͷಛੑΛސ٬ʹཧղ͍ͨͩ͘ • 100% ͷਫ਼ୡͰ͖ͳ͍ • ظίϯτϩʔϧ • υϝΠϯࣝͷ͋Δڠྗऀͷཁ
• ༻ޠͷ౷Ұ • ϢϏΩλεݴޠ • ͦͦػցֶशඞཁ? • ܾࡋऀͷίϯλΫτ • σʔλͷ༧උݕূ
Data Understanding • σʔλઃܭɾऩू • ɾΧςΰϦΧϧɾσʔλ • جຊ౷ܭྔ • ͷҙຯ
• ߲ؒͷؔ • ը૾ • ըૉͷώετάϥϜ • ࡱ૾ڥํ๏ɺ݅ͷ֬ೝ • ը૾ʹؔ͢Δఆੑతͳཧղ
TIPS • σʔλʹ͖߹͏ • ඦ݅͘Β͍ࢹ͢Δ • σʔλʹؔ͢Δײ͕ཆΘΕΔ • ͜ͷϑΣʔζऴྃ࣌ʹސ٬ͱଧͪ߹Θͤ͢Δ
͜Μͳ͜ͱ • ސ٬͕༩ͨ͠ϥϕϧ͕ؒҧ͍ͬͯΔ • ਓతϛε • ਓʹΑͬͯஅ͕ҟͳΔ • ͦͦඍົ
Data Preparation • ੳํࡦఆ (ɾΞϧΰϦζϜબఆ) • ֎Εܽଛͷѻ͍Λݕ౼ • σʔλΫϨϯδϯά •
ॏෳɾޡهɾදهΏΕͳͲͷमਖ਼ɾਖ਼نԽ • લॲཧ • σʔλ౷߹ • ϑΥʔϚοτ౷Ұ
TIPS • σΟϨΫτϦߏ • ࠶ݱੑΛ୲อ͢Δ data |—— external # ֎෦σʔλ
|—— interim # தؒՃσʔλ |—— processed # ՃࡁΈσʔλ |—- raw # ϩʔσʔλ Cookiecutter Data Science Λࢀߟʹఆٛ https://drivendata.github.io/cookiecutter-data-science/#directory-structure
Modeling • ΞϧΰϦζϜબఆ • ֶशɾσʔλੳ
TIPS • ϓϩδΣΫτ͝ͱʹ Docker ΠϝʔδΛ༻ҙ • σʔλಡΈࠐΈ༻ͷڞ༗ͷΫϥεؔΛ༻ҙ͢Δ • σʔλߏɾΫϥεઃܭͳΔ͘ૣΊʹऴ͓͑ͯ͘ •
୯७ͳσʔλूܭ૬ؔੳΛૄ͔ʹ͠ͳ͍ • ͘͢ԿࢼߦࡨޡͰ͖ΔΑ͏ʹ • ίʔυͷύϑΥʔϚϯε (࣮ߦ) ʹ͋ΔఔؾΛΔ • ίʔυϨϏϡʔΛ࣮ࢪ͢Δ • ϖΞϓϩάϥϛϯά༗ޮ • ܧଓϓϩδΣΫτॏཁͳίʔυʹ͍ͭͯϢχοτςετΛॻ͘
Evaluation • ධՁ • Cross Validation • Confusion Matrix •
ROC Curve, AUC • etc. • ߟ
• ਫ਼Λ 1%pt. ্͛Δ͜ͱ͕ͲΕ͚ͩͷϏδωεΠϯύΫ τ͕͋Δ͔
Deployment • γεςϜઃܭ • Ϟσϧਫ਼ͷϞχλϦϯά • Ϟσϧߋ৽ํ๏ͷઃܭ • Ϟσϧͷόʔδϣϯཧ •
ಋೖ • ӡ༻
TIPS • ΞϓϦέʔγϣϯΤϯδχΞ༻ͷυΩϡϝϯτ༻ҙ • API • جຊతͳར༻ํ๏ • ݱʹԿʹཧղͯ͠Β͏͔ •
ݱʹཧղͰ͖Δݴ༿Ͱઆ໌ • ݱͷ࣮ଶΛཧղ͢Δ
Q&A