データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて

 データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて

2019/06/12 みんなのPython勉強会#46 の発表スライドです

Cb7edd153cf503f44c727b73647558bf?s=128

tetsuroito

June 12, 2019
Tweet

Transcript

  1. データサイエンティスト養成読本 ビジネス活用編のこぼれ話と エンジニアとデータサイエンティストのコラボ について 2019/06/12 みんなのPython勉強会#46

  2. 誰? • 名前 : 伊藤 徹郎 (@tetsuroito) • 所属 :

    Classi株式会社 データAI部 • 属性:データサイエンティスト • マイブーム:スパイスカレー • コミュニティ ◦ Data Analyst Meetup Tokyo ◦ Machine Learning Casual Talk ◦ Data Pipeline Casual Talk など
  3. 会社の宣伝

  4. 会社の宣伝

  5. 先週の話 ワタクシ

  6. 今日の話 • 去年出版した書籍(技術評論社) • DS養成読本シリーズ5作目 • 10人の著者によるオムニバス形式 • 主な内容 ◦

    分析PJあるある ◦ ちょっとしたTips (Pythonどころかコードは1行も出てきません) 私が著者代表の一人です
  7. 何が書いてあるの?

  8. 何が書いてあるの? 分析プロジェクトの 機能要件ではなく、 非機能要件でつまづきや すいポイントのポエム

  9. 養成読本関連は色々記事あるので、そっち見て

  10. 閑話
 休題


  11. • 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 異文化理解力の重要性

  12. 最近のチームでも異なる文化の職種が多い マネジメント マーケティング エンジニアリング 製造・開発 サポート 販売 デザイン データサイエンス

  13. データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac

  14. データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac コードのリファクタリングまった なし!

  15. • 環境が同期してなくて動かない • Pythonっぽくないコードの書き方 • 何を計算しているかよくわからない • それ必要?.pyの存在 • Pandasが使われていてメモリが...

    • 運用って言葉知ってますか? • テストコード is どこ etc ... データサイエンス系のコードのリファクタがむずい *フィクションです
  16. リファクタリングの理解が噛み合わない例 エンジニア データサイエンティスト 可読性・効率・高速化 などのためにリファクタ Jupyterの途中結果消して 綺麗にすればいいんでしょ?

  17. • 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性

  18. • 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性

    お互いに背景を理解する 努力をしましょう!
  19. コミュニケーションをきちんととる • SlackなどでHRTにもとづき、普段から会話する • 心理的安全にもとづいた雑談ちょー大事 • 顔を合わせて会話する機会を作る • 炎上しない優しいPull Request

    • コードを憎んで人を憎まず • 実装意図とか、その人の書き方の好みとかを知る
  20. Google Colabでペアプロしてみる

  21. 機械学習や理論の勉強会をしてみる

  22. 達成したい目的 解決したい課題 同期 実装

  23. • 近年の現場では多様な背景のメンバーが多い • データサイエンスPJの場合も例外じゃない • それぞれのコンテキストを読み取ろう • 粒度を変えてもそれは起きうる • 目的を念頭に適切なHowを選択しよう

    まとめ
  24. 最後に PyCon US 共有会やるので、来てね!

  25. ご静聴
 ありがとう
 ございました