Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ぶんちん流データサイエンス教育のコンセプト
Search
ぶんちん
October 05, 2023
Education
0
170
ぶんちん流データサイエンス教育のコンセプト
ぶんちん
October 05, 2023
Tweet
Share
More Decks by ぶんちん
See All by ぶんちん
製造業における品質不良の要因分析04_ツール選択の考え方
bunnchinn3
0
17
これまでLT振り返り 何が人気の話題?
bunnchinn3
0
43
製造業における品質不良の要因分析03_必要な知識の入手方法
bunnchinn3
0
41
製造業における品質不良の要因分析02_分析着手順の考え方
bunnchinn3
0
41
製造業における品質不良の要因分析01_ゴール設定
bunnchinn3
0
73
良書紹介02_Head First データ解析
bunnchinn3
0
34
良書紹介01_生命科学・生物工学のための間違いから学ぶ実践統計解析
bunnchinn3
0
51
OJT指導のはじめかた
bunnchinn3
0
140
自律機械知能の行動観察
bunnchinn3
0
110
Other Decks in Education
See All in Education
Lisätty todellisuus opetuksessa
matleenalaakso
1
2.3k
Adobe Analytics入門講座【株式会社ニジボックス】
nbkouhou
0
19k
HCI and Interaction Design - Lecture 2 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
810
20240810_ワンオペ社内勉強会のノウハウ
ponponmikankan
2
880
老人会? いえ、技術継承です @ builderscon 2024 LT
s3i7h
0
110
JavaScript - Lecture 6 - Web Technologies (1019888BNR)
signer
PRO
0
2.5k
Ch2_-_Partie_3.pdf
bernhardsvt
0
100
Flinga
matleenalaakso
2
13k
東工大 traP Kaggle班 機械学習講習会 2024
abap34
2
310
横浜国立大学大学院 国際社会科学府 経営学専攻博士課程前期(社会人専修コース)_在校生体験談
miki_small_pin
0
690
アニメに学ぶチームの多様性とコンピテンシー
terahide
0
240
Tableau トレーニング【株式会社ニジボックス】
nbkouhou
0
19k
Featured
See All Featured
Statistics for Hackers
jakevdp
796
220k
Docker and Python
trallard
40
3.1k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
329
21k
BBQ
matthewcrist
85
9.3k
Building Better People: How to give real-time feedback that sticks.
wjessup
364
19k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
28
8.2k
jQuery: Nuts, Bolts and Bling
dougneiner
61
7.5k
Side Projects
sachag
452
42k
The Art of Programming - Codeland 2020
erikaheidi
52
13k
A Tale of Four Properties
chriscoyier
156
23k
How to Think Like a Performance Engineer
csswizardry
20
1.1k
Transcript
ぶんちん流 データサイエンス教育 基本コンセプト ぶんちん 2023年10月5日 データサイエンティスト集会 in VRC 1 私の仕事紹介
自己紹介 ぶんちん 複合経営が特徴の企業(製造業)に所属 データ分析担当者だったが。。。 成果獲得を狙うと、 同じことに繰り返しで 飽きた 他者にやらせたら、
成果が増えるのでは 特に非専門家向けのDS教育 2
よくある社員向け教育の勘違い 専門的な講習・教育を受けさせた! 高度な技術習得で即戦力! 組織として将来安泰! 3 現実はそんなに甘くない エライ人
外部組織
従来型教育の課題 4 基礎統計? データサイエンス? 外部講師 だから何なの? 役に立たない 業務内容と 合わない 使い道が
わからない 大きなコストをかけたにも関わらず、ほとんど成果につながらない 適用できる 綺麗なデータがない
教育コンセプトの見直し 5 技術知識 規模重視 実務能力 歩留重視 技術知識 規模重視 実務能力 歩留重視
• 講習会形式で学ぶ • 知識面の”技術”指導が中心 • 教育の達成目標が抽象的 従来:初級者向け研修 新規案:実務研修 • 自身の業務課題をOJT形式で取り組む • 業務面の”技能”指導が中心 • 基本的な業務遂行が可能で、不足する技術 は自身で学習したり専門家と連携できると いった実務能力(が身についた自信)の獲 得を目標 対象者:別分野の専門家
指導カリキュラム <前半> メインコンテンツ 重要! データ分析ツールによるGUIによるデータ可視化 コーディングによるデータも網羅的な可視化 これまで使えてこれなかったデータの特徴量化
追加した特徴量を合わせた網羅的なデータの探索 業務適用 <後半> おまけ 機械学習の基本的な知識に関する講習 機械学習モデルの作成・評価体験 実課題に対して機械学習を適用検討 6 小規模でも確実な成果 機械学習 安直な認識を叩き潰す
基本的な手法 • そこそこの性能 • 使いやすい 少し高度な手法 • 性能向上 • デメリット追加
高度な手法 • さらに性能向上 • さらなるデメリット データサイエンス技術適用の構造 7 高度な手法は基本的な手法の 単純な上位互換ではない! 課題 技術的に高度になるほど扱いづらくなっていく →案件ごとに全体最適のバランス調整が重要 座学だけでの指導は無理
実課題を使った高速課題解決ループ 残課題の 具体化 対応指導 課題対応 8 品質不良の要因分析系テーマ 1. 楽にデータ可視化したい →データ分析ツールの使い方指導
2. 一気にデータを可視化したい →簡単なコーディング 3. 大量のデータを見切れない →見るデータの優先度の決め方 ・・・ 予測モデルによる業務支援テーマ 1. 何をしたら良いかわからない →業務フローの整理 2. 何ができるかわからない →類似事例を表示しては? 3. 類似の定義は? →単純な方法から ・・・ 受講生自身の担当課題を使ったOJT教育 実際はもっと 細分化して実施 超絶基本的な段階から とにかく高速にまわす 重点的に強化
DS教育の評価 成果 受講者全員が自身の業務で活用可能な能力習得 不足する技術は自走して習得可能 課題 OJT教育しかないから規模の拡大が困難 習得能力が地味で、従来教育に受講生を取られがち 9