プリセールスデータサイエンティスト - クライアントリレーション - のススメ

8711a827470031b497f3a3b16829b2fd?s=47 mitsu666
July 29, 2019

プリセールスデータサイエンティスト - クライアントリレーション - のススメ

8711a827470031b497f3a3b16829b2fd?s=128

mitsu666

July 29, 2019
Tweet

Transcript

  1. ©2019 Crosstab, Inc. All rights reserved プリセールスデータサイエンティスト - クライアントリレーション -

    のススメ 「データ分析」だけれども「分析以外」の話を考える会 2019/07/29 19:00~ 株式会社Crosstab 代表取締役 漆畑充
  2. ©2019 Crosstab, Inc. All rights reserved 謝辞 1 ご多忙中にも関わらず本日お集まりいただきありがとうございます。 また本企画の主催者であられる「しんゆう」様、及び会場のご手配を頂い

    た株式会社 FiNC Technologies様にはこの場を借りて御礼申しあげ ます。
  3. ©2019 Crosstab, Inc. All rights reserved 代表経歴 2 プロフィール 代表取締役

    CEO 漆畑充 1982年愛知県生まれ。2005年慶應義塾大学理工学 部卒業、2007年同大学院理工学研究科修士課程修 了 修士(理学)。 2007年株式会社金融エンジニアリング・グループ入社。 金融機関向けデータ分析業務に従事。与信及びカード ローンのマーケテイングに関する数理モデルを作成。その後 大手ネット広告会社にてアドテクノロジーに関するデータ解 析を行う。またクライアントに対してデータ分析支援及び提 言/コンサルティング業務を行う。 統計モデルの作成及び特にビジネスアウトプットを重視した 分析が得意領域である。 プロジェクト実績例 • 地銀向けカードローンの信用リスク算出及びターゲティ ングモデル作成 • 某エンタメ事業者向けの顧客離反予測モデル作成 • エネルギー会社様向け法人顧客のクロスセルモデル作 成 • デジタル系企業様向けの広告効果の検証モデル作成 開発実績例(実装は含まない) • データマネジメントプラットフォームの属性推計機能及 びオーディエンス拡張機能の開発 • アドテク領域におけるクロスデバイス機能の開発(特 許取得済) • 広告出稿量の予測モデルの開発(特許取得済) Facebook https://www.facebook.com/urushibata.mitsur u Twwiter @mitsur666
  4. ©2019 Crosstab, Inc. All rights reserved 背景と目的 3 データサイエンティストが働く領域は様々、その領域ごとに必要とされるスキルも異なります。例えば自社のサービス 開発であればハッキングや解析スキルが、顧客への納品を前提としたプロジェクトではそれだけではなく顧客との折

    衝スキルも必要となります。 一方で巷でのデータサイエンティストへの教育は前者-すなわちハッキングや解析スキル-に重きが置かれる事が多 い気がします。今回は顧客向けのプロジェクトを行うために必要なスキルを簡単に解説したいと思います。具体的に はプリセールス(提案/プレアナリティクス)段階でのデータサイエンティストに求められるスキルを扱います。 他 社 向 自 社 向 B to C B to B Webサービス 法人部 門 アドテク界隈とか 伝統的大企業 原則ない 分析専門会社 広告代理店とか ハッキング/解析スキル 顧客折衝/セール ス スタートアップ *データサイエンティストの働くフィールドを2軸で切ってそれぞれのフィールドに重要なスキルを示した(勿論全部ある程度必要だが特にと思われるもの)
  5. ©2019 Crosstab, Inc. All rights reserved プリセールスとは 4 定義は色々ありますが転職サイトの(*)によると[プリセールスとは、システム構築やソフトウェア製品を販売・導入 する際に、営業担当に同行し、ITの技術的な知識を用いて、営業担当をサポートする職業です。]です。要

    するには専門的な知識を用いての営業支援を行う職種です。 当然データサイエンティストも同様にプリセールスデータサイエンティストというのがいて然るべきではないかというのが 私の考えです。プリセールスの有無はプロジェクトの成否を分けるといっても過言ではないです。 *出典 https://www.elite-network.co.jp/dictionary/presales.html 顧客 営業 データサイエンティ スト 顧客 営業 データサイエンティスト 体 制 1 体 制 2 • Q:期待値コントロールが難しい。 例えばモデルの精度に対しての 顧客希望が現実的でない場合。 • C:工数見積もりがざっくりしすぎ て価格が不適切になる。 • D:営業段階で潰しておくリスク (データが使い物にならないと か)が後工程で発覚して納期 遅延に関わる。 上の逆になる!? 体制の違いによるプロジェクトへの影響をQCDごとに示した
  6. ©2019 Crosstab, Inc. All rights reserved 体系化されたノウハウが必要だが… 5 (引用) データサイエンス協会

    http://www.datascientist.or.jp/news/2014/pdf/1210.pdf 〇関連書籍 PRML 赤本 統計学入門 その他ググれば沢山 〇関連書籍 Sql関連書籍 Python R その他ググれば沢山 〇関連書籍 ビジネスを絡めた本はある がダペンポート教授のよう なCMO/CEO向けの本が 多い。 本スライドで提案する営 業とのかかわり方みたいな ものは少ない 一方でデータサイエンティストのための営業といった論点に触れている書物は少ないと感じます。従って世間にあまり 転がっていないノウハウ、すなわち営業提案の段階でのデータサイエンティストが行動指針と具体的なノウハウを説 明します。
  7. ©2019 Crosstab, Inc. All rights reserved データ分析プロジェクト 概要 6 合意形成

    ポイント 合意形成 ポイント 合意形成 ポイント 提案 プレアナリティクス 分析 成果物作成 • プリセールスヒアリン グ • 期待値のコントロー ル • 成果物の設定 • 提案書作成支援 • 分析方向性立案 • データ連携方法確 認 • 分析工程の合意形 成 • データ受領/確認 • マスターデータ作成 • 基礎集計 • モデリング • スコアリング • 報告書の作成 • モデル定義書の作成 • スコアリングデータの 提供 サブタ スク 主ア ウト プット • 提案書 • スケジュール • 価格 • 体制 • 成果物 • 分析方向性 • データ連携図 • 分析工程図 • データ一覧 • データ作成手順 • 基礎集計表 • モデル概要 • スコアリング概要 • 最終報告書 • 一連のアウト プットを原則す べて掲載 • 実装PJの場合モデル 定義書 • スコアリングデータ 主タス ク 本稿の議題 いわゆるデータサ イエンティストが 得意な領域
  8. ©2019 Crosstab, Inc. All rights reserved 提案 フェーズ サブタスク 7

    プリセールスヒアリング • ヒアリング • 何を • いつまでに • どのデータを 使って • いくらで 期待値のコントロール • 顧客の目的/目標確 認 • できること、できないこ との切り分け • 顧客目標に合わせた 分析方向を提案 成果物の設定 • 成果物を設定 • 分析報告書 • モデル定義書 • スコアリング データリスト 提案書作成支援 • 左記の内容を踏まえて 「スケジュール」「体制」 「価格」「成果物」を盛 り込んだ内容にする • ヒアリング情報 • あれば顧客情報 • 名刺 • IR • あればRFP • 顧客目標達成と現状の ギャップ • プロジェクト遂行のボトル ネック • ギャップとボトルネックを解 消した簡易的なロード マップ • 想定成果物一覧 • 想定成果物イメージ • 提案書の一部(全体は 営業担当者作成) input output 提案フェーズは4つのサブタスクに分けることができます。 特に成果物の取りきめは重要です。
  9. ©2019 Crosstab, Inc. All rights reserved 提案 フェーズ サブタスク プリセールスヒアリング(1/2)

    8 * ヒアリングの技術については別の本や/研修資料を参照 顧客RFP等 顧客ヒアリング ヒアリング項目 アウトプット 項目 内容 顧客 目標 プロジェクトの目的その もの 何をす るか 目的達成のためのする べきこと どのよう に その方法論 データ 使用する(できる) データ 納期 プロジェクトの納期 予算 プロジェクトの予算 具体例 顧客情報を活用したマーケティング基盤の構 築 ・顧客を複数のクラスタに分類 ・潜在顧客をクラスタに振り分ける ・外部データすべてを変数にクラスタリングを行う・ク ラスタ数は10個 ・CRMデータ ・トランザクションデータ 3週間納品 xxx万 インプット 顧客ヒアリングにより、顧客の視点での目標等を整理します。ヒアリング項目は概ね顧客の目標に関わる内容と制 約(データ/納期/予算/)に関わる内容が適切です。顧客によってはRFPがある場合はそれも活用します。
  10. ©2019 Crosstab, Inc. All rights reserved 提案 フェーズ サブタスク プリセールスヒアリング(2/2)

    9 制約事項 顧客達成目標 (Object) ・顧客情報を活用したマーケティング基 盤の構築 何をするのか? (what) ・顧客を複数のクラスタに分類 どのように (How) ・CRMデータを変数にクラスタリングを行う 制約が与える影響 【納期】 ・3週間納品 【データ】 ・CRMデータ ・トランザクションデータ ・潜在顧客をクラスタに振り分ける ・DMP全体に分類するモデルを作成 ・クラスタ数は25個 【予算】 ・xxx万 想定されているデータだけではできない 多すぎるため、工数的に足りない 1 2 制約事項を考慮し顧客の要望とできることのギャップを分析します(この時点でギャップがないということは滅多にな い)まずはhowの部分にフォーカスします。
  11. ©2019 Crosstab, Inc. All rights reserved (例1) 納期/予算のギャップ 10 分析1

    分析2 分析3 顧客要望 必要十分な工数 【納期/予算 由来のギャップ解消】 基本的に工数の削減が必要です。目標達成のために過剰といえる分析数を減らします。但しで過剰であることの 根拠を説明する必要があります。 削減方法の一般論を論じることは残念ながら困難であるが、2章分析方向性立案で学ぶ内容でいくばくか対応 可能です。
  12. ©2019 Crosstab, Inc. All rights reserved (例2) データのギャップ 11 【データ由来のギャップ解消】

    実はデータ制約は緩和できる可能性があります。顧客がヒアリング時に回答したデータは顧客が保有している全 データでなく、実はとりそこねていたものがあったりするのです。したがってデータ制約のギャップ解消でまずやるべきこと は受託側から必要なデータの有無を再度確認することです。 (A) 顧客が真に利用できるデータ (B) ヒアリング時に顧客 が認識していたデータ (C) あれば 分析可能デー タ
  13. ©2019 Crosstab, Inc. All rights reserved 提案 フェーズ サブタスク 期待値コントロール(1/3)

    12 代替案を適用 どのように (How) ・CRMデータを変数 にクラスタリングを行 う ・DMP全体に拡張 するモデルを作成 ・クラスタ数は25個 想定されているデー タだけではできない 多すぎるため、工数 的に足りない 1 2 当初のとおり問題な く実行できる クラスタ数は10個に 変更 クラスタは少量 でも問題ない 旨説明 実はデータが あった 期待値の推移 初回ヒアリング時 ギャップ露見時 代替案提示時 前項のギャップ解消の代替案を適用。顧客の期待値は高すぎず、低すぎずにコントロールすることができます。
  14. ©2019 Crosstab, Inc. All rights reserved 提案 フェーズ サブタスク 期待値コントロール(2/3)

    13 簡易ロードマップ この際詳細なガントチャートは不要、メモレベルでいつから 各々の工程がどれぐらいで終わるかのみで十分。重要なの は顧客/受託側が現実的な進め方をすり合わせること 期待値の推移 初回ヒアリング時 ギャップ露見時 代替案提示時 【簡易ロードマップ】 1.データ準備 ・ファイルで受領予定。csv,tab可能。受け渡しはクラウド(情シス要確 認いついつまで)12月1日(月)予定 ・データロード 2.データクリーニング ・12月2~2日程度。都度不明点を確認する ・基礎集計を行う5日程度 →第一回めのうちあわせ(集計内容と今後の分析方向性すりあわせ) 3.分析開始 ・CRMデータからクラスタ10個作成(←事前のギャップ分析を行っている ので、リスクは回避されている) ・拡張する(これも同様前項で現実的な方法に修正したため、問題なく 進行できる) 双方で7日程度 →2回目のうちあわせ(分析結果のオーソライズ、最終報告書の章立てす りあわせ) 4.報告書作成 5日程度 FIX
  15. ©2019 Crosstab, Inc. All rights reserved 提案 フェーズ サブタスク 期待値コントロール(3/3)

    14 期待値の推移 初回ヒアリング時 ギャップ露見時 代替案無し 制約事項 顧客達成目標 (Object) ・顧客情報を活 用したマーケティン グ基盤の構築 何をするのか? (what) ・顧客を複数のク ラスタに分類 どのように (How) ・CRMデータを変 数にクラスタリング を行う 【納期】 ・3週間納品 【データ】 ・CRMデータ ・トランザクション データ ・潜在顧客をクラ スタに振り分ける ・DMP全体に拡 張するモデルを作 成 ・クラスタ数は25 個 【予算】 ・150万 想定されている データだけではでき ない 多すぎるため、工 数的に足りない 1 2 代替案無し howの中で代替案がないとき、上の階層であるwhatの代替案を考えます。すべてのwhatで代替案がない場合顧客目標が達成 不可能となり、期待値は0になります。しかし達成できないものを受注するリスクを排除しています。
  16. ©2019 Crosstab, Inc. All rights reserved 提案 フェーズ サブタスク 成果物の設定(1/2)

    15 *ただし業務委託契約においても準委任契約であれば検収が不要であるはず(要法務確認)。したがってシステムと異なりでき上りが想定できないデー タ分析プロジェクトでは準委任契約の方がリスクが少ない。 作成データ 作成スクリプト ドキュメント 打ち合わせ資 料 最終報告書 成果物 概要 主なプロジェクト内容 モデル定義書 学習データ/スコアリングデータ Sql/Python/Rコード SPSSストリーム SASスクリプト 定例及び毎回の打ち合わせ資料 PJ全体の統括な資料 パラメータ及び数式からなる書 広告/CRMターゲティング モデル開発/実装 PoC 全体で必要 PoC ビジネス企画支援 モデル開発/実装 作成負荷 低 中 中 高 高 レポート 分析結果自体 広告/CRMターゲティング 低~中 (変動)
  17. ©2019 Crosstab, Inc. All rights reserved 提案 フェーズ サブタスク 成果物の設定(2/2)

    16 広告配信 レポーティング PoC モデル開発/実装 〇 △ △ △ 〇 打ち合わせ資料 △ △ 〇 最終報告書 〇 △ モデル定義書 〇 レポート 〇 ドキュメント 作成データ 作成スクリプト 成果物/PJ内容 〇:=ほとんど要求される △:=たまに要求される 一方すべての成果物を作成すると負荷が大きいため、ここではおおよそプロジェクトの特性ごとに必要とされる成果 物をPJ内容ごとに示します。 これをもとになるべく負荷か低い成果物での合意形成を目指します。
  18. ©2019 Crosstab, Inc. All rights reserved 最後に 17 ➢提案フェーズにおいてのリスク回避 提案段階で把握し取り除くことができる物が多い。

    例えば、顧客の初期の要望に「複数のモデルを作成して比較したい」というものがあったとき、ほとんどの場合で顧客 目標達成よりも過剰な要望、すなわちもっと少ないモデルで十分である事が多い。そのため少数モデル作成を提案 し、工数負荷に関するリスクを取り除くことができる。 ➢顧客の言いなりにならない 我々の仕事は顧客の言いなりにならずに目標のための必要十分条件を示すことである。 顧客要望が目標に対して過剰になりがちな理由は、データ分析に対しての理解不足が挙げられる。そのため目標 達成のため保守的(過剰)な要望をしてしまう。 ➢目標への必要十分条件の見つけ方 経験さえ積めば誰でもできるようになる。 経験によるところが大きい。サーキットの1周目である若手は慎重になりすぎるくらいで丁度よい。PMやシニアの後を ついて複数周回して経験を積むのが良い。
  19. ©2019 Crosstab, Inc. All rights reserved 18 ご清聴ありがとうございました。 Mitsuru-urushibata@crosstab.co.jp https://crosstab.co.jp