Upgrade to Pro — share decks privately, control downloads, hide ads and more …

事業会社におけるデータサイエンティストの生き方

 事業会社におけるデータサイエンティストの生き方

Avintonジャパン株式会社さん主催の「ニューノーマルを勝ち抜く プロフェッショナル・エンジニアの条件」におけるネオキャリアセッションの登壇資料
一部情報を最新に修正
 https://connpass.com/event/184492/

Transcript

  1. 事業会社における データサイエンティストの生き方 「ニューノーマルを勝ち抜く プロフェッショナル・エンジニアの条件」 2020/09/03 Thu. 株式会社ネオキャリア 経営企画本部 天野禎章

  2. 2 • ネオキャリアが提供するSaaSプロダクトを中心に、分析組織で戦 略・分析・基盤・育成を去年より開始 • DSは求められるスキルが多く思えるが、高レベルを求められるケー スは稀で後回しでも業務遂行は可能 • (あくまでも優先度の問題で不要というわけではない) •

    分析は切り口が重要で、高度な分析よりも優れた集計もある • 「センス」を磨く上でも、曖昧な要素ほど定義して分析すること • 自分に合う企業(フェーズや採用方針など)とスキルを選び、名 前で選ばれる成果を作り続ける • 得意分野を増やしたり、大きな声で否定されることもこなせるようにした り、自身のデータ分析を分析して品質を上げる(打率を上げる) 全体サマリー
  3. 3 貪欲に学び実践し続ける (成長し続ける) データサイエンティストに最も求められるスキル

  4. • 私とネオキャリアの紹介 • 自己紹介と経歴 • 株式会社ネオキャリアの会社説明 • ネオキャリアにおける分析組織とデータ分析 • 組織の役割と職域、分析事例の紹介

    • データサイエンティストの仕事と技能 • 事業会社勤務を想定した求められる能力 • まとめとその他 • お知らせ • (これからのデータサイエンティスト) 4 目次 2-3分 4-5分 5-7分 3-5分
  5. 5 私とネオキャリアの紹介

  6. 6 自己紹介: 天野禎章(アマノヨシアキ) • 大学を含めるとデータ分析・機械学習に関わる歴は10年以上 • 「データサイエンス」が流行り出す2012年頃より前にある「データマイニング」 の時期からデータに関わる(R言語も同じくらい) • 大学時代は機械学習を用いた自然言語処理の研究

    • 最終学歴は工学修士(博士は単位取得満期退学) • 情報科学科専攻(今風に言うなら、コンピュータサイエンスやデータサイエンス学科?) • 卒業後も一貫してデータ分析に関する領域に従事 • 株式会社ネクスト(現在は株式会社LIFULL)、株式会社ファーストリテイリング、 株式会社カカクコムを経て、2019年7月に株式会社ネオキャリアに入社 • TokyoWebminingやTokyoRなどで個人的に発表、分析に関わる勉強 会には定期的に広く参加 • 趣味は読書、美味しい紅茶、いい音を聴くなど
  7. 7 会社概要 売上推移 ネオキャリアグループ 株式会社ネオキャリア ▪ 設立 ▪ 資本金 ▪

    本社 ▪ 許認可 ▪ 主要子会社 2000年11月15日 100,000,000円 東京都新宿区西新宿1-22-2 新宿サンエービル 2階 一般労働者派遣許可 許可番号 派13-070366 有料職業紹介事業許可 許可番号 13-ユ-070309 プライバシーマーク認定 10860758(07) アクサス株式会社/マーベリック株式会社/株式会社ネオラボ/ Unistyle株式会社/REERACOEN/ABROADERS CO., LTD. ▪ 従業員数 ▪ 売上高 3,698名 ※2020年9月30日時点 553億円 ※2019年9月期実績 0 5 0 1 0 0 1 5 0 2 0 0 2 5 0 3 0 0 3 5 0 4 0 0 4 5 0 5 0 0 1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 年度 1 9 553億円 ※2019年9月期実績
  8. 8 会社概要 Global 提供サービス HR Tech領域では、Web広告や自社プラットフォームメディアを活用した サービスを提供しており、全社でも特に注力しているサービス分野です。 その中でも『Calling』は、完全自社開発のWeb会議システムであり、 新しい働き方の実現に貢献していきます。 ABOUT

    US Human Resource HR Tech Healthcare その他 71 Real Platform 拠点数 (国内+海外) 20 Global Platform 拠点+サービス数 Member 3698 従業員数 ※2020年9月末 600 Engineers エンジニア数 人事関連事業を中心に、事業領域・事業エリアを拡大しています。 さらには、そうした「リアルの領域」での強みに加えて、 「ネット領域」であるHR Techなどの先端テクノロジーにその領域を広げ、成長を続けています。 株式会社ネオキャリアは様々な領域で「ヒト」と「テクノロジー」を駆使して最適なソリューションを提供し、 世界を代表するリーディングカンパニーを目指します。 Global
  9. 9 「採用・勤怠・人事情報」をシームレスに管理 1Master 1DB 人事データを統一したプラッ トフォームに集約することで、 業務効率を大幅に改善

  10. 10 すきま時間で働けるアルバイトマッチングアプリ 求職者は簡単に仕 事を見つけられ、企 業は手軽に採用が できる 求職者と企業の マッチング

  11. 今働きたい人が すぐに見つかる すきまバイトのマッチングアプリ 業務委託費の前払い分を 「Visaプリペイドカード」に即時チャージすぐに使える 11 報酬前払サービス 2020年4月30日リリース enigma pay内の「銀行振込手数

    料」と「ATM引き出し手数料」が無料
  12. 12 ネオキャリアにおける 分析組織とデータ分析

  13. 13 ネオキャリアにおける分析組織について • 経営計画を踏まえた分析の実 行計画の策定 戦 略 • データに基づく利益貢献(売 上向上・コスト削減)

    分 析 • 分析基盤の運用と全体像を踏 まえたデータ設計と統制・管理 基 盤 • データを扱う上で必要なスキ ル・マインド・センスの向上 育 成 分析組織 2019年10月に立ち上げて現在4名 「戦略」、「分析」、「基盤」 の3領域と、「教育」の1要 素からなる役割を担う
  14. • 組織の役割から個々が領域をまたがった能力を持つ必要がある • 分析を共通認識に持ち、スキル・マインドセットに応じた職域で構成 ※ データサイエンティストは協会に基づくレベルで区分 データ分析エンジニア データサイエンティスト (シニア、フル、アソシエイト、 アシスタント)

    ビジネス寄り 職域 エンジニア寄り 職域 データストラテジスト 分析基盤エンジニア データアーキテクト データ分析アーキテクト 長期・経営 寄り 短期・現場 寄り 分析組織メンバーの職域マッピング 14
  15. データ分析基盤の構成概略(基本要素のみ) 15 I/F Storage Analytics Visualization Process 分析者 企画 営業

    RAW RAW Processed Summary Analytics 分析 提供 データ データを分析基盤に集約してアクセスしやすくする(共通データ管理環境) 集めたデータは分析者が統括して品質管理する(共通データ管理環境、分析環境) データと合わせて共通利用できる分析・可視化環境を提供(分析環境、可視化環境) 集める 加工する 分析・可視化する RAW
  16. 16 分析着手中のプロダクト・領域と分析例 勤怠や人事・採用、労務などの 人事領域の統合プラットフォーム すぐに作れるプリペイド式Visa カードアプリ すきま時間で働けるアルバイトマッ チングアプリ 勤怠スコアや退職リスク予測や 人事データを活用した新機能

    不正検知、プロモーション効果測 定、コミュニティ形成 マッチング精度向上、応募・出 稿前の予測など マーケティング BtoBマーケ(リード獲得) 社内人事 社員の採用・評価・教育 CVR向上、効果測定 退職予測、ハイパフォーマ分析 プロダクト・領域 分析例
  17. 17 • 大分類が「派遣」、「飲⾷」の業界について、明細添付、メールなどのアク ションが利用率に与える影響を分析 施策 業界 規模 上がり幅 メール 飲食

    201-400 00.00% メール 派遣 1001-2000 00.00% メール 飲食 1-200 00.00% メール 派遣 201-400 00.00% メール 派遣 2001- 00.00% 飲⾷業界で201-400人規模の企業にメー ル施策をやる・やらないで利用率が〇〇倍 (約〇〇%の増加が見込み) 上がり幅TOP5 各施策で上がり幅の上位3件の業界・規模 施策 業界 規模 上がり幅 メール 飲⾷ 201-400 00.00% メール 派遣 1001-2000 00.00% メール 飲⾷ 1-200 00.00% 明細添付 派遣 801-1000 00.00% 明細添付 派遣 1-200 00.00% 明細添付 派遣 1001-2000 00.00% 明細添付×メール 派遣 1-200 0.00% 明細添付×メール 飲⾷ 201-400 0.00% 明細添付×メール 派遣 2001- 0.00% • 飲食で1-400人の⼩規模企業にメールは効果がありそう • 派遣で1000人以上の大規模、201-400の中規模企業 ではメールが効果ありそう 規模が大きい派遣業態では「明細✕メール」が マイナスで単体でプラスになるケースもあり、規 模と業種に合わせた施策実行の検討余地あり カスタマーサクセス施策分析例(数値部分は0に変換) 率を目的変数にしたモデルとなるため、ベータ回帰を利用(業界規模毎に階層化)
  18. • 「架電数と担当者接触数、アポ獲得数の合計」を用いて階層的クラスタリ ングを実施 • アポ獲得数と業務効率を勘案すると、クラスター7がハイパフォーマー 18 解釈 パフォーマンス 1 low

    2行動量が少なく、アポ獲得も芳しくない上に、離職率が高い 3 4 mid 5 行動量が多く担当者への接触回数が非常に多いが、その割 にアポの獲得状況が非常に悪い low 6 mid 7 行動量に対してアポの獲得状況が非常によく、抜群に営業 効率がよい high クラスター 1: N = 00 クラスター 2: N = 00 クラスター 3: N = 00 クラスター 4: N = 00 クラスター 5: N = 00 クラスター 6: N = 00 クラスター 7: N = 00 【クラスター別 架電数・成果の相対比較 (※) 】 ※ 各値を正規化(平均 = 0に変換)し、クラスターごとの中央値を可視化している high mid low ハイパフォーマー分析(数値部分は0に変換、解釈削除) クラスター毎の退職率を出して退職予測にも利用
  19. 19 (戦略領域については、中長期 戦略に関わるため割愛)

  20. 20 事業会社における データサイエンティスト の仕事と技能

  21. 21 • 『企業でのデータ活用の重要性が高まっている昨今、マッキンゼーの調査では、デー タを活用したデータドリブン経営による潜在価値は1000兆円以上にのぼると試算さ れています』(ストックマーク株式会社の公式プレスリリースより) データ分析によるビジネス貢献 • Tech Crunchの『データ駆動型組織になるための5つの構成要素』より引用

  22. 22 データ人材の採用激化 https://www.itmedia.co.jp/news/articles/2003/03/news068.html サイバーエージェントはAI事業本部内に 約250名の横断的な技術者組織を持つ (公式プレスリリースより)

  23. 23 • スキルを身に着けるにも範囲は広い データサイエンティストのスキルについて(ベン図) Battle of the Data Science Venn

    Diagrams
  24. 24 • スキルを身に着けるにも範囲は広い データサイエンティストのスキルについて(ベン図) Battle of the Data Science Venn

    Diagrams
  25. データ分析フェーズと採用方針 • 事業会社における分析フェーズや、「スター選手を集める方針なのか、一 般選手を戦力化する方針なのか」でも求められる人材は異なる 記述的 分析 診断的 分析 予測的 分析

    処方的 分析 BIやKPI設 計、アラート インサイト分析、 探索的データ分析 機械学習 最適化 何が起きたのか? なぜ起きたのか? 何が起きるのか? どうしたら実現 させられるか? 分析フェーズ (進むと難易度と価値は上がる) (分析種別名や流れはGarterレポートより) 25
  26. データ分析が活かされる企業 • 下記の要素は「ない」から「ある」「使える」「役に立つ」などでステップアップ し、企業の状況に応じて求められる人材は異なる 26 理解 文化 環境 人 データ

    経営層がデータ分析に理解がある(数式や理論がわから なくても分析で何ができるか、知る努力もされている) 「上司・同僚・部下(後輩)」の範囲でデータに基づく判 断を行う文化があるか どういう分析環境で分析を行うのか(マシンスペック、オンプ レ・クラウド利用) 分析を実行できる人がいるか(スキルセット・背景) 分析に用いるデータの状況はどのようになっているか コミュニケー ション層 リソース層 トップダウン ボトムアップ
  27. 27 • 要素が多く範囲は広くとも、高いレベルが求められることは さほど多くはない(分析が深く根付いた企業は除く) • 基本的なスキルや知識は3年ほどの業務で身につく認識 • 適切な指導が得られるなら約1年半、完全独学なら約5年 • 院生で論文執筆経験があれば持ち合わせていることも多い

    事業会社で求められるデータサイエンティストの「スキル」(所感) 高い専門性や幅広い知識を学ぶ 数ヶ月かける分析を数時間で こなせることも散見 「感性」を磨く センスのある単純集計の方 が役に立つことも散見 専門性を深めるか、 あるいは別の要素に広げるか
  28. 28 • 個人が専門性で引っ張っていくよりも、データを使える人を 増やして底上げするのが効果的 • 分析部門ではなく事業部門の分析能力に依存 • 「集めたデータの有効的な使い方を示す」のが「分析」の役割 • 分析結果を業務に取り込む際の高度な分析は属人化の温床

    • (「集めて使いやすく加工して提供する」のが「基盤」の役割) • 社員向けに基本スキルの教育プログラムを請け負う企業や、 分析に関わる技術・知識を学んだ学生も増えている • 向き・不向きがあり、適性がある人材を育てることも求められる 事業会社で求められるデータサイエンティストの「スキル」(所感)
  29. 29 データサイエンティスト未満のレベル定義 シニア・ データサイエンティスト アシスタント・ データサイエンティスト フル・ データサイエンティスト アソシエイト・ データサイエンティスト

    データサイエンティスト スキルレベル レベル • 業界を代表するレベル • 棟梁レベル • 独り立ちレベル • 見習いレベル • 産業領域全体 • 複合的な事業全体 • 担当プロジェクト全体 • 担当サービス全体 • 対象組織全体 • プロジェクトの担当テーマ 対応できる課題 データサイエンティスト 候補(データ使い) 一般的な社員 • 自分なりにデータを用 いた判断を導ける • 興味あるけど、試した り調べたりはしてない データアレルギー • 勘と経験とコネで通す 担当業務 • 将来的に分析をリードできそうな適性がある人材を社内で育てる 引き上げる • ビジネスを踏まえた上で、データの重要 性を理解した行動規範と判断が身に ついている • 分析の基本が身についており、課題に 対する必要なデータを入手し、分析・ レポート作成ができる • データを扱う基礎技術を有している • レポートされる数値が記憶に残らず、 課題解決で定量化する意識がない • 基本統計量を正しく理解せずに「平均 年収」を鵜呑みにしたり、可視化の仕 方が不適切だったりする • スプレッドシートで集計ができない (データサイエンティストスキルレベルをベースに作成) 適性あり人材
  30. 30 • スキル • 分析業務を進める上で欠かせない姿勢と技能を持っているか • 「ビジネス、データサイエンス、プログラミング(Excel)」の項目でチェック • この要素が足りないと、自分で分析を進めるのが困難になる •

    マインド • 分析業務を効率良く進める上で望ましい志向性を持っているか • 「チーム、数値感覚、学習意欲(インプット)、好奇心」の項目でチェック • この要素が足りないと、分析の実施に高い人的コストが発生しやすくなる • 感性 • 分析から有用な知見を得る上で必要となるセンスを持っているか • 「視点、発想、柔軟さ、現場感」の項目でチェック • この要素が足りないと、受け取り手にとって役に立たない分析を行ってしまう 適性を測る評価軸を定義
  31. 31 軸にレベルを定義して適性を測る(感性) Lv 視点(見方) 発想 柔軟さ 現場感 1 自分の立場でしか物事を 考えられず、他人からの指

    摘も批判として捉えてしまう 説明をする際にたとえ話が すぐに思いつかない こだわりすぎて失敗したり、 時間に追われるあまりに仕 事が雑になったりする 協働するプロジェクトの 課題を先方側の能力 不足ばかりを主張 2 何気ない言動で相手を怒 らせることがたまにある 意見や考え方が他人の真 似が多い 頭が固い・頑固など、身近 な人に度々言われる 手段や道具を使うの が目的になりがち 3 同じ職種で仕事をする上 司・先輩であれば、意図を 半分以上は察せられる 周りが思いつかないアイデア が出るため、意見を求められ ることがある なぞなぞ・頭の体操といった 種類のクイズで、初級レベル はわりと解ける 上級職による調整の もとで、業務を進めら れる 4 異なる背景の相手に合わ せた会話ができ、同じ目的 に意見を合わせていける 全く異なるふたつの事柄の 要素を分解して、似た部分 を繋げて考えられる 議論をしていて、意見を変 えた代案がすぐに出て、相 手を納得させられる 担当者と会話しながら、 目的が大きくずれず進 められる 5 同じ事柄を複数の観点・ 立場から見て、利点・欠点 を見出すことができる 複数事例を分解・整理し、 新しい発想を生み出したり、 ルールやパターンを見つけら れたりする 漠然とした事柄から要件を 定義し、共通項目や重要 度を整理できる 担当部署で活用可 能な結果を出せ、次 のアクションにも繋がる 各要素を測る質問項目や課題を作成
  32. 32 まとめとその他

  33. 33 • 求められるスキルが多く思えるが、高レベルを求められる企 業やフェーズでない限りは後回しでも業務遂行は可能 • 分析は切り口が重要で、属人化する高度な分析よりも優れた 集計は起こりえる(高度な分析ができると工数短縮は可能) • 視点や発想などのテクニカルスキル以外を鍛えるのは、データや 課題から仮説を導くのに有効

    • 適性のような曖昧な要素ほど定義して分析対象に • 最も必要な適性は「学び続けられる」ことでは? • 尤もらしいことを言う人も多いが、鵜呑みは避けて考える • あるある話やたとえ話で共感を誘う、主張を断言する人など まとめ
  34. 34 • ネオキャリアグループサイト • 文章解析AIトップベンチャーのストックマーク、WiLから資金調達 • データ駆動型組織になるための5つの構成要素 • LINE、機械学習エンジニアなどAI技術者の採用強化 21年中に200

    人に拡大 • AIを活用したデジタル広告事業の強化・新規AI事業の開発を目的に、 AI事業本部を発足 • Battle of the Data Science Venn Diagrams • データサイエンティスト協会スキル委員会4thシンポジウム講演資料 • データサイエンティストのためのスキルチェックリスト/タスクリスト概説 (PDF) 参考・引用元
  35. 35 お知らせ ネオキャリア データ分析ブログを始めます

  36. None
  37. 37 • ネオキャリアが提供するSaaSプロダクトを中心に、分析組織で戦 略・分析・基盤・育成を去年より開始 • DSは求められるスキルが多く思えるが、高レベルを求められるケー スは稀で後回しでも業務遂行は可能 • (あくまでも優先度の問題で不要というわけではない) •

    分析は切り口が重要で、高度な分析よりも優れた集計もある • 「センス」を磨く上でも、曖昧な要素ほど定義して分析すること • 自分に合う企業(フェーズや採用方針など)とスキルを選び、名 前で選ばれる成果を作り続ける • 得意分野を増やしたり、大きな声で否定されることもこなせるようにした り、自身のデータ分析を分析して品質を上げる(打率を上げる) 全体サマリー(再掲)
  38. 今働きたい人が すぐに見つかる すきまバイトのマッチングアプリ

  39. 39 これからのデータサイエンティスト

  40. 40 • データを扱うスキルと経験を持っていることが当たり前になる • 直近の未経験人材は基盤エンジニアを入口にすると良い • 分析コンペや勉強会で発表を繰り返して、名前を知ってもらう • 「適切な指導ができる人がいる分析フェーズ初期の企業」 から始めて、分析業務全般をこなせるようになる(=「じゃ

    んけん」で全部を出せる状態を作る) • 次に経営/会計/人事/セキュリティ/知財/法律などの周辺 知識も得る(=「じゃんけん」以外でも勝てるようにする) • 分析の専門性特化は魅力的に見えるが、自分より教育もスキ ルも得た人材が年々増えていく中で勝ち続けるのは困難 これからデータサイエンティストを目指す人へ
  41. 41 • それでも分析に特化したい人は? • データ分析のみに注力できる企業(分析結果を実装して くれるエンジニアが多く所属)やポジションを狙う • リファラル紹介 • Kaggleに人生を捧げてソロメダル・入賞を増やす

    • 海外の有名国際学会やジャーナルに論文を何度も通す • 勉強会発表やブログ記事執筆を繰り返して書籍を出版する これからデータサイエンティストを目指す人へ 学び実践し続け、名前を広く知れ渡るようにする
  42. 42 • データを使える人を増やそうとして、分析をツールでブラック ボックス化したデータドリブン企業も増えている • ツールが出す数字を盲目的に信じる(「分析ツールドリブン」) • (ダッシュボードを見て仕事した気になる) • 可視化された数字の原因を説明できずに想像で補完

    • ビジネスモデルが優れていて、概算値のモニタリングだけで業務が回 るならこれで十分 • 扱えるデータが荒いと施策も荒くなる(分析粒度の荒さ) • より細かいデータで仮説を磨く(研磨)ことが重要 • 課題に適したアプローチ・道具を選べる能力を身につける • 木を切るにはチェンソーが優れているが、ロープを切るには不適切 これからデータサイエンティストを目指す人へ
  43. 43 • 「意思決定を支える」以上に貢献しないといけない • 社内コンサルやPoCしかしない部署はコストカットの対象 • 意思決定を支えるだけなら、PdMが分析できる方が望ましい • データを必ず使う、あるいは起爆剤となるプロダクトを作る •

    データや分析が外付けのビジネスモデルでは分析は使われない • データ分析の品質管理に心掛ける • 属人化しがちな分析の品質を担保し、打率を上げていく(自 分のデータ分析を分析する) • 名前で選ばれるようにする • 会社名ではなく個人名で覚えてもらう(ブランディング) これからデータサイエンティストがこの先生き残るには
  44. 44 • 関係者のデータリテラシー・モラルなどを高める • データの民主化を広げようと試みると、オレオレダッシュボードや 野良KPIが増える • 統制化やデータリテラシー向上を進める • データを使える人が増えると、説得のために編集した数字を出

    す人が出てくる • データに対するモラルを根付かせる(データに真摯であること) • 統制化・モラル向上が進むと、データに対する過度な信仰が生 まれる • データバイアスに対する理解やデータ・インフォームドの考えを伝える これからデータサイエンティストがこの先生き残るには
  45. 45 • データと課題から仮説を生み出す「仮説探索型」の分析 にも慣れる • 目的や仮説が定まった分析は作業になりがちで、仕組み化・ 自動化を検討すべき • 事業会社の場合は受け持つプロダクトと長く付き合う傾向 •

    毎日データを見る習慣を作り、空いた時間で挙がった課題 に関連するデータを俯瞰する癖をつける • データから仮説を見つけるのは難しく、まずは課題からデータを 見て仮説を見つける流れに慣れる • 担当者から相談されて仮説が思いつきやすくなる これからデータサイエンティストがこの先生き残るには