Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習プロジェクトの進め方
Search
Hacarus Inc.
June 17, 2019
Technology
1
5k
機械学習プロジェクトの進め方
機械学習プロジェクトの進め方と各フェーズにおいてハカルスで行っていることについてのお話です。
Hacarus Inc.
June 17, 2019
Tweet
Share
More Decks by Hacarus Inc.
See All by Hacarus Inc.
QA4AIに則ったMLOpsツールの活用
hacarus
0
570
0から協働ロボット外観検査システムを3ヵ月で具現化した軌跡
hacarus
0
91
ワンちゃんの健康を願う皆様に送る 犬心電図AI解析プロダクト紹介_AWS DevDay2022
hacarus
0
110
犬の心電AI解析プロダクト開発奮闘記 _クラウドからハード開発までてんこ盛り
hacarus
0
1.3k
ExplainableAIの概要とAmazon SageMaker Clarifyでの実装例
hacarus
0
630
AWS Step Functions を用いた非同期学習処理の例
hacarus
0
660
Dashでmyダッシュボードを作ろう ーpytrendsで見るコロナの感染拡大時期ー
hacarus
0
890
Interpretable Machine Learning: モデル非依存な解釈手法の紹介
hacarus
0
750
時系列データ予測手法の宇宙天気予報への応用
hacarus
0
1k
Other Decks in Technology
See All in Technology
複雑な構成要素を持つUIとの向き合い方 〜新・支出グラフでの実例〜 / B43 TECH TALK
nakamuuu
0
130
「スニダン」開発組織の構造に込めた意図 ~組織作りはパッションや政治ではない!~
rinchsan
3
490
ここが嬉しいABAC ここが辛いよABAC #再解説+補足編
masahirokawahara
1
260
2024/4/26 コンピュータ歴史博物館解説告知
toshi_atsumi
0
210
DevOpsメトリクスとアウトカムの接続にトライ!開発プロセスを通して計測できるメトリクスの活用方法
ham0215
2
230
ユーザーストーリーのレビューを自動化したみたの
bun913
1
400
SPI原点回帰論:事業課題とFour Keysの結節点を見出す実践的ソフトウェアプロセス改善 / DevOpsDays Tokyo 2024
visional_engineering_and_design
4
1.9k
ServiceNow Knowledge 24の歩き方 EYストラテジー・アンド・コンサルティング
manarobot
0
170
Postman v10リリース後を振り返る
nagix
0
170
Hands-on Gemini, the Google DeepMind LLM
meteatamel
1
110
Vertex AI を中心に 生成AIのアップデートを共有します
kaz1437
0
280
JSON攻略法.pdf
miyakemito
8
4.6k
Featured
See All Featured
No one is an island. Learnings from fostering a developers community.
thoeni
15
2.1k
A better future with KSS
kneath
231
16k
10 Git Anti Patterns You Should be Aware of
lemiorhan
647
58k
RailsConf 2023
tenderlove
2
530
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
1
3.4k
VelocityConf: Rendering Performance Case Studies
addyosmani
320
23k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
18
6.9k
Ruby is Unlike a Banana
tanoku
96
10k
Done Done
chrislema
178
15k
Git: the NoSQL Database
bkeepers
PRO
422
63k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
13
1.5k
Building Applications with DynamoDB
mza
88
5.6k
Transcript
ػցֶशϓϩδΣΫτ ͷਐΊํ MACHINE LEARNING Meetup KANSAI #5 2019-06-17 גࣜձࣾϋΧϧε ދथ
ࣗݾհ ދ थ גࣜձࣾϋΧϧε CDO (Chief Data Officer) 2011͔ΒػցֶशϓϩδΣΫτʹؔΘΓ࢝ΊΔ ͱͱΞϓϦέʔγϣϯΤϯδχΞɾΠϯϑϥΤϯδχΞ
ࠓ͓͍ͨ͜͠ͱ ػցֶशϓϩδΣΫτͷਐΊํͱ֤ϑΣʔζʹ͓͍ͯϋΧϧ εͰߦ͍ͬͯΔ͜ͱ
ػցֶशϓϩδΣΫτ֓؍ Business Understanding Data Understanding Data Preparation Modeling Evaluation Deployment
PoC
Business Understanding • తɾഎܠͷཧղ • ղ͖͘ͷఆٛ • ධՁࢦඪɾඪͷઃఆ • ϏδωεσβΠϯɾຊ൪ಋೖΠϝʔδ
• ϏδωεΠϯύΫτ • ֹۚࢉ
TIPS • ػցֶशͷಛੑΛސ٬ʹཧղ͍ͨͩ͘ • 100% ͷਫ਼ୡͰ͖ͳ͍ • ظίϯτϩʔϧ • υϝΠϯࣝͷ͋Δڠྗऀͷཁ
• ༻ޠͷ౷Ұ • ϢϏΩλεݴޠ • ͦͦػցֶशඞཁ? • ܾࡋऀͷίϯλΫτ • σʔλͷ༧උݕূ
Data Understanding • σʔλઃܭɾऩू • ɾΧςΰϦΧϧɾσʔλ • جຊ౷ܭྔ • ͷҙຯ
• ߲ؒͷؔ • ը૾ • ըૉͷώετάϥϜ • ࡱ૾ڥํ๏ɺ݅ͷ֬ೝ • ը૾ʹؔ͢Δఆੑతͳཧղ
TIPS • σʔλʹ͖߹͏ • ඦ݅͘Β͍ࢹ͢Δ • σʔλʹؔ͢Δײ͕ཆΘΕΔ • ͜ͷϑΣʔζऴྃ࣌ʹސ٬ͱଧͪ߹Θͤ͢Δ
͜Μͳ͜ͱ • ސ٬͕༩ͨ͠ϥϕϧ͕ؒҧ͍ͬͯΔ • ਓతϛε • ਓʹΑͬͯஅ͕ҟͳΔ • ͦͦඍົ
Data Preparation • ੳํࡦఆ (ɾΞϧΰϦζϜબఆ) • ֎Εܽଛͷѻ͍Λݕ౼ • σʔλΫϨϯδϯά •
ॏෳɾޡهɾදهΏΕͳͲͷमਖ਼ɾਖ਼نԽ • લॲཧ • σʔλ౷߹ • ϑΥʔϚοτ౷Ұ
TIPS • σΟϨΫτϦߏ • ࠶ݱੑΛ୲อ͢Δ data |—— external # ֎෦σʔλ
|—— interim # தؒՃσʔλ |—— processed # ՃࡁΈσʔλ |—- raw # ϩʔσʔλ Cookiecutter Data Science Λࢀߟʹఆٛ https://drivendata.github.io/cookiecutter-data-science/#directory-structure
Modeling • ΞϧΰϦζϜબఆ • ֶशɾσʔλੳ
TIPS • ϓϩδΣΫτ͝ͱʹ Docker ΠϝʔδΛ༻ҙ • σʔλಡΈࠐΈ༻ͷڞ༗ͷΫϥεؔΛ༻ҙ͢Δ • σʔλߏɾΫϥεઃܭͳΔ͘ૣΊʹऴ͓͑ͯ͘ •
୯७ͳσʔλूܭ૬ؔੳΛૄ͔ʹ͠ͳ͍ • ͘͢ԿࢼߦࡨޡͰ͖ΔΑ͏ʹ • ίʔυͷύϑΥʔϚϯε (࣮ߦ) ʹ͋ΔఔؾΛΔ • ίʔυϨϏϡʔΛ࣮ࢪ͢Δ • ϖΞϓϩάϥϛϯά༗ޮ • ܧଓϓϩδΣΫτॏཁͳίʔυʹ͍ͭͯϢχοτςετΛॻ͘
Evaluation • ධՁ • Cross Validation • Confusion Matrix •
ROC Curve, AUC • etc. • ߟ
• ਫ਼Λ 1%pt. ্͛Δ͜ͱ͕ͲΕ͚ͩͷϏδωεΠϯύΫ τ͕͋Δ͔
Deployment • γεςϜઃܭ • Ϟσϧਫ਼ͷϞχλϦϯά • Ϟσϧߋ৽ํ๏ͷઃܭ • Ϟσϧͷόʔδϣϯཧ •
ಋೖ • ӡ༻
TIPS • ΞϓϦέʔγϣϯΤϯδχΞ༻ͷυΩϡϝϯτ༻ҙ • API • جຊతͳར༻ํ๏ • ݱʹԿʹཧղͯ͠Β͏͔ •
ݱʹཧղͰ͖Δݴ༿Ͱઆ໌ • ݱͷ࣮ଶΛཧղ͢Δ
Q&A