Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコ...
Search
tetsuroito
June 12, 2019
Education
3
3.3k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
2019/06/12 みんなのPython勉強会#46 の発表スライドです
tetsuroito
June 12, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.8k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
850
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
640
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
5.8k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.8k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
140
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.5k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.9k
サブスクリプションミートアップOPトークスライド
tetsuroito
0
4.8k
Other Decks in Education
See All in Education
Gaps in Therapy in IBD - IBDInnovate 2025 CCF
higgi13425
0
480
自己紹介 / who-am-i
yasulab
PRO
3
5.2k
Pythonパッケージ管理 [uv] 完全入門
mickey_kubo
20
14k
生成AIとの上手な付き合い方【公開版】/ How to Get Along Well with Generative AI (Public Version)
handlename
0
470
第1回大学院理工学系説明会|東京科学大学(Science Tokyo)
sciencetokyo
PRO
0
3.8k
2025年度春学期 統計学 第2回 統計資料の収集と読み方(講義前配付用) (2025. 4. 17)
akiraasano
PRO
0
140
Data Physicalisation - Lecture 9 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
440
モンテカルロ法(3) 発展的アルゴリズム / Simulation 04
kaityo256
PRO
7
1.3k
Info Session MSc Computer Science & MSc Applied Informatics
signer
PRO
0
180
미국 교환학생 가서 무료 홈스테이 살면서 인턴 취업하기
maryang
0
110
SkimaTalk Teacher Guidelines Summary
skimatalk
0
790k
マネジメント「される側」 こそ覚悟を決めろ
nao_randd
10
5.3k
Featured
See All Featured
Art, The Web, and Tiny UX
lynnandtonic
299
21k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Making Projects Easy
brettharned
116
6.3k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Designing Experiences People Love
moore
142
24k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2.1k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
20k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
4 Signs Your Business is Dying
shpigford
184
22k
Building Applications with DynamoDB
mza
95
6.5k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Transcript
データサイエンティスト養成読本 ビジネス活用編のこぼれ話と エンジニアとデータサイエンティストのコラボ について 2019/06/12 みんなのPython勉強会#46
誰? • 名前 : 伊藤 徹郎 (@tetsuroito) • 所属 :
Classi株式会社 データAI部 • 属性:データサイエンティスト • マイブーム:スパイスカレー • コミュニティ ◦ Data Analyst Meetup Tokyo ◦ Machine Learning Casual Talk ◦ Data Pipeline Casual Talk など
会社の宣伝
会社の宣伝
先週の話 ワタクシ
今日の話 • 去年出版した書籍(技術評論社) • DS養成読本シリーズ5作目 • 10人の著者によるオムニバス形式 • 主な内容 ◦
分析PJあるある ◦ ちょっとしたTips (Pythonどころかコードは1行も出てきません) 私が著者代表の一人です
何が書いてあるの?
何が書いてあるの? 分析プロジェクトの 機能要件ではなく、 非機能要件でつまづきや すいポイントのポエム
養成読本関連は色々記事あるので、そっち見て
閑話 休題
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 異文化理解力の重要性
最近のチームでも異なる文化の職種が多い マネジメント マーケティング エンジニアリング 製造・開発 サポート 販売 デザイン データサイエンス
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac コードのリファクタリングまった なし!
• 環境が同期してなくて動かない • Pythonっぽくないコードの書き方 • 何を計算しているかよくわからない • それ必要?.pyの存在 • Pandasが使われていてメモリが...
• 運用って言葉知ってますか? • テストコード is どこ etc ... データサイエンス系のコードのリファクタがむずい *フィクションです
リファクタリングの理解が噛み合わない例 エンジニア データサイエンティスト 可読性・効率・高速化 などのためにリファクタ Jupyterの途中結果消して 綺麗にすればいいんでしょ?
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
お互いに背景を理解する 努力をしましょう!
コミュニケーションをきちんととる • SlackなどでHRTにもとづき、普段から会話する • 心理的安全にもとづいた雑談ちょー大事 • 顔を合わせて会話する機会を作る • 炎上しない優しいPull Request
• コードを憎んで人を憎まず • 実装意図とか、その人の書き方の好みとかを知る
Google Colabでペアプロしてみる
機械学習や理論の勉強会をしてみる
達成したい目的 解決したい課題 同期 実装
• 近年の現場では多様な背景のメンバーが多い • データサイエンスPJの場合も例外じゃない • それぞれのコンテキストを読み取ろう • 粒度を変えてもそれは起きうる • 目的を念頭に適切なHowを選択しよう
まとめ
最後に PyCon US 共有会やるので、来てね!
ご静聴 ありがとう ございました