Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習プロジェクトの進め方
Search
Hacarus Inc.
June 17, 2019
Technology
1
5.4k
機械学習プロジェクトの進め方
機械学習プロジェクトの進め方と各フェーズにおいてハカルスで行っていることについてのお話です。
Hacarus Inc.
June 17, 2019
Tweet
Share
More Decks by Hacarus Inc.
See All by Hacarus Inc.
GitLab CI/CD で C#/WPFアプリケーションのテストとインストーラーのビルド・デプロイを自動化する
hacarus
0
1.2k
QA4AIに則ったMLOpsツールの活用
hacarus
0
680
0から協働ロボット外観検査システムを3ヵ月で具現化した軌跡
hacarus
0
240
ワンちゃんの健康を願う皆様に送る 犬心電図AI解析プロダクト紹介_AWS DevDay2022
hacarus
0
190
犬の心電AI解析プロダクト開発奮闘記 _クラウドからハード開発までてんこ盛り
hacarus
0
1.7k
ExplainableAIの概要とAmazon SageMaker Clarifyでの実装例
hacarus
0
970
AWS Step Functions を用いた非同期学習処理の例
hacarus
0
1.2k
Dashでmyダッシュボードを作ろう ーpytrendsで見るコロナの感染拡大時期ー
hacarus
0
1.4k
Interpretable Machine Learning: モデル非依存な解釈手法の紹介
hacarus
0
1k
Other Decks in Technology
See All in Technology
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
8.6k
Goss: New Production-Ready Go Binding for Faiss #coefl_go_jp
bengo4com
0
1.1k
AIとTDDによるNext.js「隙間ツール」開発の実践
makotot
5
660
ドキュメントはAIの味方!スタートアップのアジャイルを加速するADR
kawauso
3
340
イオン店舗一覧ページのパフォーマンスチューニング事例 / Performance tuning example for AEON store list page
aeonpeople
2
270
Yahoo!ニュースにおけるソフトウェア開発
lycorptech_jp
PRO
0
340
開発と脆弱性と脆弱性診断についての話
su3158
1
1.1k
あとはAIに任せて人間は自由に生きる
kentaro
3
1.1k
ECS モニタリング手法大整理
yendoooo
1
120
つくって納得、つかって実感! 大規模言語モデルことはじめ
recruitengineers
PRO
19
5k
浸透しなさいRFC 5322&7208
hinono
0
120
Understanding Go GC #coefl_go_jp
bengo4com
0
1.1k
Featured
See All Featured
Agile that works and the tools we love
rasmusluckow
329
21k
Designing for humans not robots
tammielis
253
25k
Building Applications with DynamoDB
mza
96
6.6k
Speed Design
sergeychernyshev
32
1.1k
Raft: Consensus for Rubyists
vanstee
140
7.1k
A designer walks into a library…
pauljervisheath
207
24k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.4k
Git: the NoSQL Database
bkeepers
PRO
431
65k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
How to Ace a Technical Interview
jacobian
279
23k
A Modern Web Designer's Workflow
chriscoyier
695
190k
It's Worth the Effort
3n
187
28k
Transcript
ػցֶशϓϩδΣΫτ ͷਐΊํ MACHINE LEARNING Meetup KANSAI #5 2019-06-17 גࣜձࣾϋΧϧε ދथ
ࣗݾհ ދ थ גࣜձࣾϋΧϧε CDO (Chief Data Officer) 2011͔ΒػցֶशϓϩδΣΫτʹؔΘΓ࢝ΊΔ ͱͱΞϓϦέʔγϣϯΤϯδχΞɾΠϯϑϥΤϯδχΞ
ࠓ͓͍ͨ͜͠ͱ ػցֶशϓϩδΣΫτͷਐΊํͱ֤ϑΣʔζʹ͓͍ͯϋΧϧ εͰߦ͍ͬͯΔ͜ͱ
ػցֶशϓϩδΣΫτ֓؍ Business Understanding Data Understanding Data Preparation Modeling Evaluation Deployment
PoC
Business Understanding • తɾഎܠͷཧղ • ղ͖͘ͷఆٛ • ධՁࢦඪɾඪͷઃఆ • ϏδωεσβΠϯɾຊ൪ಋೖΠϝʔδ
• ϏδωεΠϯύΫτ • ֹۚࢉ
TIPS • ػցֶशͷಛੑΛސ٬ʹཧղ͍ͨͩ͘ • 100% ͷਫ਼ୡͰ͖ͳ͍ • ظίϯτϩʔϧ • υϝΠϯࣝͷ͋Δڠྗऀͷཁ
• ༻ޠͷ౷Ұ • ϢϏΩλεݴޠ • ͦͦػցֶशඞཁ? • ܾࡋऀͷίϯλΫτ • σʔλͷ༧උݕূ
Data Understanding • σʔλઃܭɾऩू • ɾΧςΰϦΧϧɾσʔλ • جຊ౷ܭྔ • ͷҙຯ
• ߲ؒͷؔ • ը૾ • ըૉͷώετάϥϜ • ࡱ૾ڥํ๏ɺ݅ͷ֬ೝ • ը૾ʹؔ͢Δఆੑతͳཧղ
TIPS • σʔλʹ͖߹͏ • ඦ݅͘Β͍ࢹ͢Δ • σʔλʹؔ͢Δײ͕ཆΘΕΔ • ͜ͷϑΣʔζऴྃ࣌ʹސ٬ͱଧͪ߹Θͤ͢Δ
͜Μͳ͜ͱ • ސ٬͕༩ͨ͠ϥϕϧ͕ؒҧ͍ͬͯΔ • ਓతϛε • ਓʹΑͬͯஅ͕ҟͳΔ • ͦͦඍົ
Data Preparation • ੳํࡦఆ (ɾΞϧΰϦζϜબఆ) • ֎Εܽଛͷѻ͍Λݕ౼ • σʔλΫϨϯδϯά •
ॏෳɾޡهɾදهΏΕͳͲͷमਖ਼ɾਖ਼نԽ • લॲཧ • σʔλ౷߹ • ϑΥʔϚοτ౷Ұ
TIPS • σΟϨΫτϦߏ • ࠶ݱੑΛ୲อ͢Δ data |—— external # ֎෦σʔλ
|—— interim # தؒՃσʔλ |—— processed # ՃࡁΈσʔλ |—- raw # ϩʔσʔλ Cookiecutter Data Science Λࢀߟʹఆٛ https://drivendata.github.io/cookiecutter-data-science/#directory-structure
Modeling • ΞϧΰϦζϜબఆ • ֶशɾσʔλੳ
TIPS • ϓϩδΣΫτ͝ͱʹ Docker ΠϝʔδΛ༻ҙ • σʔλಡΈࠐΈ༻ͷڞ༗ͷΫϥεؔΛ༻ҙ͢Δ • σʔλߏɾΫϥεઃܭͳΔ͘ૣΊʹऴ͓͑ͯ͘ •
୯७ͳσʔλूܭ૬ؔੳΛૄ͔ʹ͠ͳ͍ • ͘͢ԿࢼߦࡨޡͰ͖ΔΑ͏ʹ • ίʔυͷύϑΥʔϚϯε (࣮ߦ) ʹ͋ΔఔؾΛΔ • ίʔυϨϏϡʔΛ࣮ࢪ͢Δ • ϖΞϓϩάϥϛϯά༗ޮ • ܧଓϓϩδΣΫτॏཁͳίʔυʹ͍ͭͯϢχοτςετΛॻ͘
Evaluation • ධՁ • Cross Validation • Confusion Matrix •
ROC Curve, AUC • etc. • ߟ
• ਫ਼Λ 1%pt. ্͛Δ͜ͱ͕ͲΕ͚ͩͷϏδωεΠϯύΫ τ͕͋Δ͔
Deployment • γεςϜઃܭ • Ϟσϧਫ਼ͷϞχλϦϯά • Ϟσϧߋ৽ํ๏ͷઃܭ • Ϟσϧͷόʔδϣϯཧ •
ಋೖ • ӡ༻
TIPS • ΞϓϦέʔγϣϯΤϯδχΞ༻ͷυΩϡϝϯτ༻ҙ • API • جຊతͳར༻ํ๏ • ݱʹԿʹཧղͯ͠Β͏͔ •
ݱʹཧղͰ͖Δݴ༿Ͱઆ໌ • ݱͷ࣮ଶΛཧղ͢Δ
Q&A