Slide 1

Slide 1 text

データサイエンティスト養成読本 ビジネス活用編のこぼれ話と エンジニアとデータサイエンティストのコラボ について 2019/06/12 みんなのPython勉強会#46

Slide 2

Slide 2 text

誰? ● 名前 : 伊藤 徹郎 (@tetsuroito) ● 所属 : Classi株式会社 データAI部 ● 属性:データサイエンティスト ● マイブーム:スパイスカレー ● コミュニティ ○ Data Analyst Meetup Tokyo ○ Machine Learning Casual Talk ○ Data Pipeline Casual Talk など

Slide 3

Slide 3 text

会社の宣伝

Slide 4

Slide 4 text

会社の宣伝

Slide 5

Slide 5 text

先週の話 ワタクシ

Slide 6

Slide 6 text

今日の話 ● 去年出版した書籍(技術評論社) ● DS養成読本シリーズ5作目 ● 10人の著者によるオムニバス形式 ● 主な内容 ○ 分析PJあるある ○ ちょっとしたTips (Pythonどころかコードは1行も出てきません) 私が著者代表の一人です

Slide 7

Slide 7 text

何が書いてあるの?

Slide 8

Slide 8 text

何が書いてあるの? 分析プロジェクトの 機能要件ではなく、 非機能要件でつまづきや すいポイントのポエム

Slide 9

Slide 9 text

養成読本関連は色々記事あるので、そっち見て

Slide 10

Slide 10 text

閑話
 休題


Slide 11

Slide 11 text

● 相手の言動の真意を理解する ● 自分の言動を相手がどう捉えているかを理 解する ● 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 異文化理解力の重要性

Slide 12

Slide 12 text

最近のチームでも異なる文化の職種が多い マネジメント マーケティング エンジニアリング 製造・開発 サポート 販売 デザイン データサイエンス

Slide 13

Slide 13 text

データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac

Slide 14

Slide 14 text

データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac コードのリファクタリングまった なし!

Slide 15

Slide 15 text

● 環境が同期してなくて動かない ● Pythonっぽくないコードの書き方 ● 何を計算しているかよくわからない ● それ必要?.pyの存在 ● Pandasが使われていてメモリが... ● 運用って言葉知ってますか? ● テストコード is どこ etc ... データサイエンス系のコードのリファクタがむずい *フィクションです

Slide 16

Slide 16 text

リファクタリングの理解が噛み合わない例 エンジニア データサイエンティスト 可読性・効率・高速化 などのためにリファクタ Jupyterの途中結果消して 綺麗にすればいいんでしょ?

Slide 17

Slide 17 text

● 相手の言動の真意を理解する ● 自分の言動を相手がどう捉えているかを理 解する ● 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性

Slide 18

Slide 18 text

● 相手の言動の真意を理解する ● 自分の言動を相手がどう捉えているかを理 解する ● 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性 お互いに背景を理解する 努力をしましょう!

Slide 19

Slide 19 text

コミュニケーションをきちんととる ● SlackなどでHRTにもとづき、普段から会話する ● 心理的安全にもとづいた雑談ちょー大事 ● 顔を合わせて会話する機会を作る ● 炎上しない優しいPull Request ● コードを憎んで人を憎まず ● 実装意図とか、その人の書き方の好みとかを知る

Slide 20

Slide 20 text

Google Colabでペアプロしてみる

Slide 21

Slide 21 text

機械学習や理論の勉強会をしてみる

Slide 22

Slide 22 text

達成したい目的 解決したい課題 同期 実装

Slide 23

Slide 23 text

● 近年の現場では多様な背景のメンバーが多い ● データサイエンスPJの場合も例外じゃない ● それぞれのコンテキストを読み取ろう ● 粒度を変えてもそれは起きうる ● 目的を念頭に適切なHowを選択しよう まとめ

Slide 24

Slide 24 text

最後に PyCon US 共有会やるので、来てね!

Slide 25

Slide 25 text

ご静聴
 ありがとう
 ございました