2019/06/12 みんなのPython勉強会#46 の発表スライドです
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて2019/06/12 みんなのPython勉強会#46
View Slide
誰?● 名前 : 伊藤 徹郎 (@tetsuroito)● 所属 : Classi株式会社 データAI部● 属性:データサイエンティスト● マイブーム:スパイスカレー● コミュニティ○ Data Analyst Meetup Tokyo○ Machine Learning Casual Talk○ Data Pipeline Casual Talk など
会社の宣伝
先週の話ワタクシ
今日の話● 去年出版した書籍(技術評論社)● DS養成読本シリーズ5作目● 10人の著者によるオムニバス形式● 主な内容○ 分析PJあるある○ ちょっとしたTips(Pythonどころかコードは1行も出てきません)私が著者代表の一人です
何が書いてあるの?
何が書いてあるの?分析プロジェクトの機能要件ではなく、非機能要件でつまづきやすいポイントのポエム
養成読本関連は色々記事あるので、そっち見て
閑話 休題
● 相手の言動の真意を理解する● 自分の言動を相手がどう捉えているかを理解する● 育った環境や価値観が異なる人と働くときに、行き違いや誤解を生むことなく、確かな信頼を築く技術異文化理解力の重要性
最近のチームでも異なる文化の職種が多いマネジメントマーケティングエンジニアリング製造・開発サポート販売デザインデータサイエンス
データサイエンスとエンジニアリングの違いPoCやプロトをプロダクションに乗せたい引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac
データサイエンスとエンジニアリングの違いPoCやプロトをプロダクションに乗せたい引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1acコードのリファクタリングまったなし!
● 環境が同期してなくて動かない● Pythonっぽくないコードの書き方● 何を計算しているかよくわからない● それ必要?.pyの存在● Pandasが使われていてメモリが...● 運用って言葉知ってますか?● テストコード is どこetc ...データサイエンス系のコードのリファクタがむずい*フィクションです
リファクタリングの理解が噛み合わない例エンジニア データサイエンティスト可読性・効率・高速化などのためにリファクタJupyterの途中結果消して綺麗にすればいいんでしょ?
● 相手の言動の真意を理解する● 自分の言動を相手がどう捉えているかを理解する● 育った環境や価値観が異なる人と働くときに、行き違いや誤解を生むことなく、確かな信頼を築く技術(再掲)異文化理解力の重要性
● 相手の言動の真意を理解する● 自分の言動を相手がどう捉えているかを理解する● 育った環境や価値観が異なる人と働くときに、行き違いや誤解を生むことなく、確かな信頼を築く技術(再掲)異文化理解力の重要性お互いに背景を理解する努力をしましょう!
コミュニケーションをきちんととる● SlackなどでHRTにもとづき、普段から会話する● 心理的安全にもとづいた雑談ちょー大事● 顔を合わせて会話する機会を作る● 炎上しない優しいPull Request● コードを憎んで人を憎まず● 実装意図とか、その人の書き方の好みとかを知る
Google Colabでペアプロしてみる
機械学習や理論の勉強会をしてみる
達成したい目的解決したい課題同期実装
● 近年の現場では多様な背景のメンバーが多い● データサイエンスPJの場合も例外じゃない● それぞれのコンテキストを読み取ろう● 粒度を変えてもそれは起きうる● 目的を念頭に適切なHowを選択しようまとめ
最後にPyCon US 共有会やるので、来てね!
ご静聴 ありがとう ございました