Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコ...
Search
tetsuroito
June 12, 2019
Education
3
3.4k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
2019/06/12 みんなのPython勉強会#46 の発表スライドです
tetsuroito
June 12, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
Data Engineering Study#30 LT資料
tetsuroito
2
1.7k
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.9k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
880
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
680
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
6k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
5k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
160
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.6k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
2.1k
Other Decks in Education
See All in Education
The browser strikes back
jonoalderson
0
300
【洋書和訳:さよならを待つふたりのために】第1章 出会いとメタファー
yaginumatti
0
160
【ZEPメタバース校舎操作ガイド】
ainischool
0
760
ThingLink
matleenalaakso
28
4.3k
1008
cbtlibrary
0
130
AIを使って最新研究 について調べて発表しよ う!
mickey_kubo
4
180
HCI Research Methods - Lecture 7 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.3k
IKIGAI World Fes:program
tsutsumi
1
2.6k
核軍備撤廃に向けた次の大きな一歩─核兵器を先には使わないと核保有国が約束すること
hide2kano
0
210
授業レポート:共感と協調のリーダーシップ(2025年上期)
jibunal
1
190
コマンドラインを見直そう(1995年からタイムリープ)
sapi_kawahara
0
640
KBS新事業創造体験2025_科目説明会
yasuchikawakayama
0
160
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
730
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
7.9k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
0
280
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
2.8k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
Abbi's Birthday
coloredviolet
0
4.3k
Everyday Curiosity
cassininazir
0
120
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
78
Game over? The fight for quality and originality in the time of robots
wayneb77
1
78
Evolving SEO for Evolving Search Engines
ryanjones
0
98
Transcript
データサイエンティスト養成読本 ビジネス活用編のこぼれ話と エンジニアとデータサイエンティストのコラボ について 2019/06/12 みんなのPython勉強会#46
誰? • 名前 : 伊藤 徹郎 (@tetsuroito) • 所属 :
Classi株式会社 データAI部 • 属性:データサイエンティスト • マイブーム:スパイスカレー • コミュニティ ◦ Data Analyst Meetup Tokyo ◦ Machine Learning Casual Talk ◦ Data Pipeline Casual Talk など
会社の宣伝
会社の宣伝
先週の話 ワタクシ
今日の話 • 去年出版した書籍(技術評論社) • DS養成読本シリーズ5作目 • 10人の著者によるオムニバス形式 • 主な内容 ◦
分析PJあるある ◦ ちょっとしたTips (Pythonどころかコードは1行も出てきません) 私が著者代表の一人です
何が書いてあるの?
何が書いてあるの? 分析プロジェクトの 機能要件ではなく、 非機能要件でつまづきや すいポイントのポエム
養成読本関連は色々記事あるので、そっち見て
閑話 休題
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 異文化理解力の重要性
最近のチームでも異なる文化の職種が多い マネジメント マーケティング エンジニアリング 製造・開発 サポート 販売 デザイン データサイエンス
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac コードのリファクタリングまった なし!
• 環境が同期してなくて動かない • Pythonっぽくないコードの書き方 • 何を計算しているかよくわからない • それ必要?.pyの存在 • Pandasが使われていてメモリが...
• 運用って言葉知ってますか? • テストコード is どこ etc ... データサイエンス系のコードのリファクタがむずい *フィクションです
リファクタリングの理解が噛み合わない例 エンジニア データサイエンティスト 可読性・効率・高速化 などのためにリファクタ Jupyterの途中結果消して 綺麗にすればいいんでしょ?
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
お互いに背景を理解する 努力をしましょう!
コミュニケーションをきちんととる • SlackなどでHRTにもとづき、普段から会話する • 心理的安全にもとづいた雑談ちょー大事 • 顔を合わせて会話する機会を作る • 炎上しない優しいPull Request
• コードを憎んで人を憎まず • 実装意図とか、その人の書き方の好みとかを知る
Google Colabでペアプロしてみる
機械学習や理論の勉強会をしてみる
達成したい目的 解決したい課題 同期 実装
• 近年の現場では多様な背景のメンバーが多い • データサイエンスPJの場合も例外じゃない • それぞれのコンテキストを読み取ろう • 粒度を変えてもそれは起きうる • 目的を念頭に適切なHowを選択しよう
まとめ
最後に PyCon US 共有会やるので、来てね!
ご静聴 ありがとう ございました