Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
June 12, 2019
Education
3
2.9k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
2019/06/12 みんなのPython勉強会#46 の発表スライドです
tetsuroito
June 12, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
970
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
360
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
0
340
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
4.3k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
3.5k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
76
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
910
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.4k
サブスクリプションミートアップOPトークスライド
tetsuroito
0
4.2k
Other Decks in Education
See All in Education
AWS認定、オンラインで受けるか?オフラインで受けるか?
amarelo_n24
0
160
Classi_会社紹介資料
classijp
8
46k
プログラミング授業実践事例 ~「探究」への活用を目指して~
asial_edu
0
300
ファイル操作 / Python File
kaityo256
PRO
0
800
Hololens2と 小中高プログラミング教育の利用にむけた試行 / XRMTG 2023-1-18
gishi_yama
0
140
SkimaTalk Teacher Guidelines
skimatalk
0
2.1k
使用済み燃料プール火災の恐怖
hide2kano
0
240
6000名以上の高校生に行われた VR教育の実践と課題
sifue
0
3.5k
Web Search and SEO - Lecture 10 - Web Technologies (1019888BNR)
signer
PRO
2
1.4k
論文の書き方 -2022年度版-
imash
0
520
Panorama Cybersécurité & robotique 2022
cyberdeck
0
220
Statistical Rethinking 2023 - Lecture 03
rmcelreath
1
540
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
37
5.9k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
270
12k
A better future with KSS
kneath
230
16k
10 Git Anti Patterns You Should be Aware of
lemiorhan
643
54k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
22
1.7k
Rebuilding a faster, lazier Slack
samanthasiow
69
7.5k
Web development in the modern age
philhawksworth
197
9.6k
4 Signs Your Business is Dying
shpigford
171
20k
A Philosophy of Restraint
colly
193
15k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
236
1.1M
Infographics Made Easy
chrislema
235
17k
What the flash - Photography Introduction
edds
64
10k
Transcript
データサイエンティスト養成読本 ビジネス活用編のこぼれ話と エンジニアとデータサイエンティストのコラボ について 2019/06/12 みんなのPython勉強会#46
誰? • 名前 : 伊藤 徹郎 (@tetsuroito) • 所属 :
Classi株式会社 データAI部 • 属性:データサイエンティスト • マイブーム:スパイスカレー • コミュニティ ◦ Data Analyst Meetup Tokyo ◦ Machine Learning Casual Talk ◦ Data Pipeline Casual Talk など
会社の宣伝
会社の宣伝
先週の話 ワタクシ
今日の話 • 去年出版した書籍(技術評論社) • DS養成読本シリーズ5作目 • 10人の著者によるオムニバス形式 • 主な内容 ◦
分析PJあるある ◦ ちょっとしたTips (Pythonどころかコードは1行も出てきません) 私が著者代表の一人です
何が書いてあるの?
何が書いてあるの? 分析プロジェクトの 機能要件ではなく、 非機能要件でつまづきや すいポイントのポエム
養成読本関連は色々記事あるので、そっち見て
閑話 休題
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 異文化理解力の重要性
最近のチームでも異なる文化の職種が多い マネジメント マーケティング エンジニアリング 製造・開発 サポート 販売 デザイン データサイエンス
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac コードのリファクタリングまった なし!
• 環境が同期してなくて動かない • Pythonっぽくないコードの書き方 • 何を計算しているかよくわからない • それ必要?.pyの存在 • Pandasが使われていてメモリが...
• 運用って言葉知ってますか? • テストコード is どこ etc ... データサイエンス系のコードのリファクタがむずい *フィクションです
リファクタリングの理解が噛み合わない例 エンジニア データサイエンティスト 可読性・効率・高速化 などのためにリファクタ Jupyterの途中結果消して 綺麗にすればいいんでしょ?
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
お互いに背景を理解する 努力をしましょう!
コミュニケーションをきちんととる • SlackなどでHRTにもとづき、普段から会話する • 心理的安全にもとづいた雑談ちょー大事 • 顔を合わせて会話する機会を作る • 炎上しない優しいPull Request
• コードを憎んで人を憎まず • 実装意図とか、その人の書き方の好みとかを知る
Google Colabでペアプロしてみる
機械学習や理論の勉強会をしてみる
達成したい目的 解決したい課題 同期 実装
• 近年の現場では多様な背景のメンバーが多い • データサイエンスPJの場合も例外じゃない • それぞれのコンテキストを読み取ろう • 粒度を変えてもそれは起きうる • 目的を念頭に適切なHowを選択しよう
まとめ
最後に PyCon US 共有会やるので、来てね!
ご静聴 ありがとう ございました