Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データサイエンス教育 コンセプト
Search
ぶんちん
October 05, 2023
Education
0
110
データサイエンス教育 コンセプト
ぶんちん
October 05, 2023
Tweet
Share
More Decks by ぶんちん
See All by ぶんちん
良書紹介02_Head First データ解析
bunnchinn3
0
1
良書紹介01_生命科学・生物工学のための間違いから学ぶ実践統計解析
bunnchinn3
0
2
OJT指導のはじめかた
bunnchinn3
0
67
自律機械知能の行動観察
bunnchinn3
0
55
DSプロジェクト課題の探し方
bunnchinn3
0
73
DSプロジェクト課題の選び方(難度の見極め方)
bunnchinn3
0
61
データサイエンス業務 最初の一歩
bunnchinn3
0
120
JTCで役に立つR AnalyticFlowの紹介
bunnchinn3
0
56
実務で使えるOrange Data Miningの便利な機能
bunnchinn3
0
420
Other Decks in Education
See All in Education
論文の読み方 / How to survey
kaityo256
PRO
181
120k
心房細動週間ポスター(2024年3月6日)
japanstrokeassociation
0
290
Padlet opetuksessa
matleenalaakso
3
11k
人生の転機からチャンスを掴む「シュロスバーグの4Sモデル」/4s-models
yuko_yokouchi
3
790
Ch7_-_Partie_2.pdf
bernhardsvt
0
130
「最初の本」の紹介
eltociear
0
110
Data Presentation - Lecture 5 - Information Visualisation (4019538FNR)
signer
PRO
0
1.8k
Interactive Tabletops and Surfaces - Lecture 5 - Next Generation User Interfaces (4018166FNR)
signer
PRO
1
1.2k
Interaction - Lecture 10 - Information Visualisation (4019538FNR)
signer
PRO
0
1.3k
Часто задаваемые вопросы
pnuslide
0
30k
Introduction - Lecture 1 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
3.1k
LTをすべき100の理由
eltociear
1
310
Featured
See All Featured
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
15
1.6k
GitHub's CSS Performance
jonrohan
1025
450k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
34
8.9k
How To Stay Up To Date on Web Technology
chriscoyier
782
250k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
20
1.8k
Embracing the Ebb and Flow
colly
80
4.2k
Docker and Python
trallard
35
2.7k
Visualization
eitanlees
137
14k
Atom: Resistance is Futile
akmur
260
25k
Raft: Consensus for Rubyists
vanstee
133
6.3k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
26
2.3k
It's Worth the Effort
3n
180
27k
Transcript
ぶんちん流 データサイエンス教育 基本コンセプト ぶんちん 2023年10月5日 データサイエンティスト集会 in VRC 1 私の仕事紹介
自己紹介 ぶんちん 複合経営が特徴の企業(製造業)に所属 データ分析担当者だったが。。。 成果獲得を狙うと、 同じことに繰り返しで 飽きた 他者にやらせたら、
成果が増えるのでは 特に非専門家向けのDS教育 2
よくある社員向け教育の勘違い 専門的な講習・教育を受けさせた! 高度な技術習得で即戦力! 組織として将来安泰! 3 現実はそんなに甘くない エライ人
外部組織
従来型教育の課題 4 基礎統計? データサイエンス? 外部講師 だから何なの? 役に立たない 業務内容と 合わない 使い道が
わからない 大きなコストをかけたにも関わらず、ほとんど成果につながらない 適用できる 綺麗なデータがない
教育コンセプトの見直し 5 技術知識 規模重視 実務能力 歩留重視 技術知識 規模重視 実務能力 歩留重視
• 講習会形式で学ぶ • 知識面の”技術”指導が中心 • 教育の達成目標が抽象的 従来:初級者向け研修 新規案:実務研修 • 自身の業務課題をOJT形式で取り組む • 業務面の”技能”指導が中心 • 基本的な業務遂行が可能で、不足する技術 は自身で学習したり専門家と連携できると いった実務能力(が身についた自信)の獲 得を目標 対象者:別分野の専門家
指導カリキュラム <前半> メインコンテンツ 重要! データ分析ツールによるGUIによるデータ可視化 コーディングによるデータも網羅的な可視化 これまで使えてこれなかったデータの特徴量化
追加した特徴量を合わせた網羅的なデータの探索 業務適用 <後半> おまけ 機械学習の基本的な知識に関する講習 機械学習モデルの作成・評価体験 実課題に対して機械学習を適用検討 6 小規模でも確実な成果 機械学習 安直な認識を叩き潰す
基本的な手法 • そこそこの性能 • 使いやすい 少し高度な手法 • 性能向上 • デメリット追加
高度な手法 • さらに性能向上 • さらなるデメリット データサイエンス技術適用の構造 7 高度な手法は基本的な手法の 単純な上位互換ではない! 課題 技術的に高度になるほど扱いづらくなっていく →案件ごとに全体最適のバランス調整が重要 座学だけでの指導は無理
実課題を使った高速課題解決ループ 残課題の 具体化 対応指導 課題対応 8 品質不良の要因分析系テーマ 1. 楽にデータ可視化したい →データ分析ツールの使い方指導
2. 一気にデータを可視化したい →簡単なコーディング 3. 大量のデータを見切れない →見るデータの優先度の決め方 ・・・ 予測モデルによる業務支援テーマ 1. 何をしたら良いかわからない →業務フローの整理 2. 何ができるかわからない →類似事例を表示しては? 3. 類似の定義は? →単純な方法から ・・・ 受講生自身の担当課題を使ったOJT教育 実際はもっと 細分化して実施 超絶基本的な段階から とにかく高速にまわす 重点的に強化
DS教育の評価 成果 受講者全員が自身の業務で活用可能な能力習得 不足する技術は自走して習得可能 課題 OJT教育しかないから規模の拡大が困難 習得能力が地味で、従来教育に受講生を取られがち 9