Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習プロジェクトの進め方
Search
Hacarus Inc.
June 17, 2019
Technology
1
5.5k
機械学習プロジェクトの進め方
機械学習プロジェクトの進め方と各フェーズにおいてハカルスで行っていることについてのお話です。
Hacarus Inc.
June 17, 2019
Tweet
Share
More Decks by Hacarus Inc.
See All by Hacarus Inc.
GitLab CI/CD で C#/WPFアプリケーションのテストとインストーラーのビルド・デプロイを自動化する
hacarus
0
1.3k
QA4AIに則ったMLOpsツールの活用
hacarus
0
710
0から協働ロボット外観検査システムを3ヵ月で具現化した軌跡
hacarus
0
260
ワンちゃんの健康を願う皆様に送る 犬心電図AI解析プロダクト紹介_AWS DevDay2022
hacarus
0
200
犬の心電AI解析プロダクト開発奮闘記 _クラウドからハード開発までてんこ盛り
hacarus
0
1.8k
ExplainableAIの概要とAmazon SageMaker Clarifyでの実装例
hacarus
0
1.1k
AWS Step Functions を用いた非同期学習処理の例
hacarus
0
1.4k
Dashでmyダッシュボードを作ろう ーpytrendsで見るコロナの感染拡大時期ー
hacarus
0
1.5k
Interpretable Machine Learning: モデル非依存な解釈手法の紹介
hacarus
0
1.1k
Other Decks in Technology
See All in Technology
AzureでのIaC - Bicep? Terraform? それ早く言ってよ会議
torumakabe
1
610
AWS DevOps Agent x ECS on Fargate検証 / AWS DevOps Agent x ECS on Fargate
kinunori
2
190
CDK対応したAWS DevOps Agentを試そう_20260201
masakiokuda
1
430
制約が導く迷わない設計 〜 信頼性と運用性を両立するマイナンバー管理システムの実践 〜
bwkw
3
1.1k
今日から始めるAmazon Bedrock AgentCore
har1101
4
420
茨城の思い出を振り返る ~CDKのセキュリティを添えて~ / 20260201 Mitsutoshi Matsuo
shift_evolve
PRO
1
410
Agile Leadership Summit Keynote 2026
m_seki
1
680
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1.7k
旅先で iPad + Neovim で iOS 開発・執筆した話
zozotech
PRO
0
100
Bedrock PolicyでAmazon Bedrock Guardrails利用を強制してみた
yuu551
0
260
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
560
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
3
220
Featured
See All Featured
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
120
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
71k
The agentic SEO stack - context over prompts
schlessera
0
650
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
160
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
GitHub's CSS Performance
jonrohan
1032
470k
Crafting Experiences
bethany
1
53
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
Facilitating Awesome Meetings
lara
57
6.8k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
Transcript
ػցֶशϓϩδΣΫτ ͷਐΊํ MACHINE LEARNING Meetup KANSAI #5 2019-06-17 גࣜձࣾϋΧϧε ދथ
ࣗݾհ ދ थ גࣜձࣾϋΧϧε CDO (Chief Data Officer) 2011͔ΒػցֶशϓϩδΣΫτʹؔΘΓ࢝ΊΔ ͱͱΞϓϦέʔγϣϯΤϯδχΞɾΠϯϑϥΤϯδχΞ
ࠓ͓͍ͨ͜͠ͱ ػցֶशϓϩδΣΫτͷਐΊํͱ֤ϑΣʔζʹ͓͍ͯϋΧϧ εͰߦ͍ͬͯΔ͜ͱ
ػցֶशϓϩδΣΫτ֓؍ Business Understanding Data Understanding Data Preparation Modeling Evaluation Deployment
PoC
Business Understanding • తɾഎܠͷཧղ • ղ͖͘ͷఆٛ • ධՁࢦඪɾඪͷઃఆ • ϏδωεσβΠϯɾຊ൪ಋೖΠϝʔδ
• ϏδωεΠϯύΫτ • ֹۚࢉ
TIPS • ػցֶशͷಛੑΛސ٬ʹཧղ͍ͨͩ͘ • 100% ͷਫ਼ୡͰ͖ͳ͍ • ظίϯτϩʔϧ • υϝΠϯࣝͷ͋Δڠྗऀͷཁ
• ༻ޠͷ౷Ұ • ϢϏΩλεݴޠ • ͦͦػցֶशඞཁ? • ܾࡋऀͷίϯλΫτ • σʔλͷ༧උݕূ
Data Understanding • σʔλઃܭɾऩू • ɾΧςΰϦΧϧɾσʔλ • جຊ౷ܭྔ • ͷҙຯ
• ߲ؒͷؔ • ը૾ • ըૉͷώετάϥϜ • ࡱ૾ڥํ๏ɺ݅ͷ֬ೝ • ը૾ʹؔ͢Δఆੑతͳཧղ
TIPS • σʔλʹ͖߹͏ • ඦ݅͘Β͍ࢹ͢Δ • σʔλʹؔ͢Δײ͕ཆΘΕΔ • ͜ͷϑΣʔζऴྃ࣌ʹސ٬ͱଧͪ߹Θͤ͢Δ
͜Μͳ͜ͱ • ސ٬͕༩ͨ͠ϥϕϧ͕ؒҧ͍ͬͯΔ • ਓతϛε • ਓʹΑͬͯஅ͕ҟͳΔ • ͦͦඍົ
Data Preparation • ੳํࡦఆ (ɾΞϧΰϦζϜબఆ) • ֎Εܽଛͷѻ͍Λݕ౼ • σʔλΫϨϯδϯά •
ॏෳɾޡهɾදهΏΕͳͲͷमਖ਼ɾਖ਼نԽ • લॲཧ • σʔλ౷߹ • ϑΥʔϚοτ౷Ұ
TIPS • σΟϨΫτϦߏ • ࠶ݱੑΛ୲อ͢Δ data |—— external # ֎෦σʔλ
|—— interim # தؒՃσʔλ |—— processed # ՃࡁΈσʔλ |—- raw # ϩʔσʔλ Cookiecutter Data Science Λࢀߟʹఆٛ https://drivendata.github.io/cookiecutter-data-science/#directory-structure
Modeling • ΞϧΰϦζϜબఆ • ֶशɾσʔλੳ
TIPS • ϓϩδΣΫτ͝ͱʹ Docker ΠϝʔδΛ༻ҙ • σʔλಡΈࠐΈ༻ͷڞ༗ͷΫϥεؔΛ༻ҙ͢Δ • σʔλߏɾΫϥεઃܭͳΔ͘ૣΊʹऴ͓͑ͯ͘ •
୯७ͳσʔλूܭ૬ؔੳΛૄ͔ʹ͠ͳ͍ • ͘͢ԿࢼߦࡨޡͰ͖ΔΑ͏ʹ • ίʔυͷύϑΥʔϚϯε (࣮ߦ) ʹ͋ΔఔؾΛΔ • ίʔυϨϏϡʔΛ࣮ࢪ͢Δ • ϖΞϓϩάϥϛϯά༗ޮ • ܧଓϓϩδΣΫτॏཁͳίʔυʹ͍ͭͯϢχοτςετΛॻ͘
Evaluation • ධՁ • Cross Validation • Confusion Matrix •
ROC Curve, AUC • etc. • ߟ
• ਫ਼Λ 1%pt. ্͛Δ͜ͱ͕ͲΕ͚ͩͷϏδωεΠϯύΫ τ͕͋Δ͔
Deployment • γεςϜઃܭ • Ϟσϧਫ਼ͷϞχλϦϯά • Ϟσϧߋ৽ํ๏ͷઃܭ • Ϟσϧͷόʔδϣϯཧ •
ಋೖ • ӡ༻
TIPS • ΞϓϦέʔγϣϯΤϯδχΞ༻ͷυΩϡϝϯτ༻ҙ • API • جຊతͳར༻ํ๏ • ݱʹԿʹཧղͯ͠Β͏͔ •
ݱʹཧղͰ͖Δݴ༿Ͱઆ໌ • ݱͷ࣮ଶΛཧղ͢Δ
Q&A