Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データサイエンス系プロジェクトにおける構想策定の重要性 / Importance of dat...

データサイエンス系プロジェクトにおける構想策定の重要性 / Importance of data science project planning

2021年6月4日開催 Women in Data Science Tokyo @ IBM
DATA SCIENTIST TALK#2資料
Speaker: 阪野 美穂
アソシエート・パートナー
コグニティブ・アナリティクス
グローバル・ビジネス・サービス
日本アイ・ビー・エム株式会社

https://widstokyoibm2021.splashthat.com/

wids-tky-i

June 04, 2021
Tweet

More Decks by wids-tky-i

Other Decks in Technology

Transcript

  1. 2.ご存じでしたか…? ~3割のAIプロジェクトは失敗すると言われている 3% 31% 36% 19% 6% 3% 0% 1-9%

    10-29% 30-49% 50% or more Don’t know N = 1910; Base=Personas 2 and 3 respondents Source: IDC AI StrategiesView, March 2020
  2. 2.ご存じでしたか…? ~その理由は概ね”構想策定の不備” 31% 34% 29% 29% 30% 35% 27% 28%

    28% 29% 0% Unrealistic expectations Lacked staff with necessary expertise Did not have the necessary data Lack of production ready data pipelines for diverse data sources Lack of an Integrated Development environment from experimentation to production AI technology didn't perform as expected or as promised Results that were too disruptive to current business processes Output that wasn't actionable Lack of follow-up from the business units The business case wasn't well-enough understood Other (please specify) Don't know AIに期待しすぎた データサイエンティスト不足 データが足りなかった データソースが確保できなかった PoCからproductionまで使える分析環境が準備できてなかった 検討した手法で成果が出なかった 業務に組み込めなかった モデルの結果をアクションに落とし込めなかった 事業部からの支援を受けられなかった ビジネスケースをうまいこと作れなかった その他 ワカラン N = 1791; Base=Respondents indicated organization's AI projects have failed Source: IDC AI StrategiesView, March 2020
  3. 3.構想策定とは何ぞや ~構想策定の中身 下記のプロセスで実際の構想策定をすすめます 実行計画策定・ トライアル 打ち手の検討 打ち手の評価 現状把握・データ調査 現状、どんな課題があるのか 対象となる設備・業務は何か

    データはどこに存在するのか データはモデル作成に十分な データか 優先順位が高い課題は何か それぞれの課題に対してどのよ うな打ち手が考えられるか (i.e.どのようなアルゴリズムが 適用できるのか) どの程度ビジネス効果が見込 めるか 現状の技術で、どの程度実 現可能性が見込めるか 業務に組み込みは可能か PoCを実施対象を検討する PoCの計画案をつくる 構想策定 ビジネス効果:5億円/年 実現可能性:高 〇 ビジネス効果:0.1億円/年 実現可能性:高 × ビジネス効果:50億円/年 実現可能性:現状低い × ?
  4. 3.構想策定とは何ぞや ~データサイエンティストこそ、構想策定を AIプロジェクトでは構想策定フェーズのタスクのうち半分以上がデータサイエンスの知見が必要です 実行計画策定・ トライアル 打ち手の検討 打ち手の評価 現状把握・データ調査 現状、どんな課題があるのか 対象となる設備・業務は何か

    データはどこに存在するのか データはモデル作成に十分な データか 優先順位が高い課題は何か それぞれの課題に対してどの ような打ち手が考えられるか (i.e.どのようなアルゴリズム が適用できるのか) どの程度ビジネス効果が見込 めるか 現状の技術で、どの程度実 現可能性が見込めるか 業務に組み込みは可能か PoCを実施対象を検討する PoCの計画案をつくる ビジネス効果:5億円/年 実現可能性:高 〇 ビジネス効果:0.1億円/年 実現可能性:高 × ビジネス効果:50億円/年 実現可能性:現状低い × ? 構想策定
  5. 4.構想策定で失敗は防げる! ~よくある失敗例 AIプロジェクトでよくある失敗例は下記の通りです。これらは、構想策定を十分にやりきれば防げる失敗です データサイエンティ ストがいないんだ もん!50人イケ イケのデータサイエ ンティストさえいれ ば! その50人、本当に必要ですか。

    本当に97%じゃないと失敗ですか。 (なんで97%なんですか?) 精度82%って失 敗じゃない? 97%はないと厳し いよね? データが足りな かった。。。 PoCの前段階でデータが十分か どうか確認しましょう ケースその① データ不足 ケースその② データサイエンティスト不足 ケースその③ 精度が期待値未達
  6. データがそもそもど のテーブルにあるの かも、各項目の意 味もわからない 5.妄想ケーススタディ ~株式会社 ほっこりネットワークの例 下記のようなケーススタディを考えてみましょう IT系だし、データちゃんと 整備されていると思ったん

    だけど。。  株式会社 ほっこりネットワークはIT黎明期から活動し ている古参の情報通信企業である  もともとネットワーク事業単体だったが、合併等を繰り返 して法人向け&コンシューマ向け各種サービス等、多 数の事業を抱えるようになった  現在、ほっこりネットワーク社内では大規模予算のもと AI活用を進めているが、不振のネットワーク事業につい てまずテコ入れが求められている ⇒社内のデータを活用して離反予測モデルを構築したい もうPoC開始しちゃったん だけど、ぜんぜんデータ加 工が終わらないってベンダ ーが言ってる。。 ネットワーク事業担当の声 ケーススタディ
  7. 5.妄想ケーススタディ ~株式会社 ほっこりネットワークの例 PoCの前に、下記の観点をチェックしてPoCに足るデータかどうか確認する必要があります 一旦データがそ ろうまでPoC 開始は待とう データサイエンティストによる データ確認・プレ分析 データを持つ部署とのネゴ・

    データ担当者のアサイン確認 データ加工・分析 環境の確保 データの事前チェックをデータ担当者とデータサイエンティストが連携しながら実施することが重要です え、加工?どう みても2か月か かるんじゃない すか この**フラグが合併で仕様 が変わっているのが致命的だ から20XX年以降のデータを 使うしかないですよね。この部 署マスターの値が20YY以降 で変わってるんですけど、え、 前後の変換マスタがどこにある かわからない?そりゃまいったな すぐ探してくださいよそもそも 顧客情報はTable X、売り上げ情 報はTable Yに入ってます。注意と してはTable Xは20XX以降は Table X’になっているので売り上げ 情報の期間を見てXかX’に紐づけま す。ちなみにYの売上合計粒度が 20YY年に代わっていて、20YY以 前は事業本部単位、以降は営業 部単位になっているので部署マスタ を期間に分けて紐づける必要があり ますねちなみにどういう粒度で集計し ますか、え、きまってない?そもそも 必要なソフトウェ ア・環境等はデー タサイエンティスト にチェックさせる
  8. 50か所それぞれに データサイエンティ ストを置くのよ 5.妄想ケーススタディ ~株式会社 ニコニコインシュアランスの例 下記のようなケーススタディを考えてみましょう 今年度中に成果を出さ ないといけないから、全営 業所でPoCをやるわ

     株式会社 ニコニコインシュアランスは中堅の保険会社 である  全国50か所に営業支店があり、それぞれでAI活用を すすめたいと考えている  ニコニコインシュアランスのDX担当は、トップからの指令 を受けてDX推進を進めており、本年度中に成果を出 すことを求められている ⇒DX推進のため、データサイエンティストを追加すること を検討している 50か所それぞれで、モデ ルを作りこむんだからそれ だけデータサイエンティスト 必要でしょ? DX担当の声 ケーススタディ
  9. 5.妄想ケーススタディ ~株式会社 ニコニコインシュアランスの例 データサイエンティストを多数かかえずとも成果を出す方法はあります まずは5人ででき るところやって成 果を出そうかしら “成果”の再定義 今期中に 成果を…

    成果とは 何ぞや? モデル・基盤共通化(コンテナ化) 優先順位付け・絞り込み 離反率 まずはここだけ注力 (パレートの法則) そのほか、段階的PoC実施、AutoML系ツールの導入等、検討すべきポイントはたくさんあります
  10. AIは高いんだし、 高い精度出しても らわないと。97% とかね? 5.妄想ケーススタディ ~株式会社 お弁当太郎の例 下記のようなケーススタディを考えてみましょう とりあえず御贔屓さんに 松コースをすすめてるんだ

    けど、厳しいんだよね。。 10社に1社ぐらいかな。。 営業担当は数名しかい ないから、アタックできるの は月に100件が限界か な。。 営業担当の声  株式会社 お弁当太郎では、B2B(企業向け)に 弁当の定期購入サービスを提供している  お弁当プランには松コース、竹コース、梅コースがある  営業担当は、プランをアップグレードしてくれそうなお客さ んに対し、営業をかけているが、担当が数名のため、ア タックできる客数には限界がある ⇒営業業務を効率化するために、機械学習で アップグレードしてくれる客の予測を行いたい ケーススタディ
  11. 5.妄想ケーススタディ ~株式会社 お弁当太郎の例 実際の業務(ここでは営業可能な件数)を踏まえると、効果を十分に訴求できるケースがある ID 氏名 … 確率 00001 中山出版株式会社

    95% 00002 YAMAHATA株式会社 95% 00003 株式会社四崎商事 90% … 00100 Inoue & Co. 85% … 00500 高柳運送株式会社 70% 今までの業務の 9倍効率的!  アップグレード確率が70%以上の場合アップグレードする と仮定  顧客500件のうち410件が実際にアップグレード ⇒精度82% ID 氏名 … 確率 00001 中山出版株式会社 95% 00002 YAMAHATA株式会社 95% 00003 株式会社四崎商事 90% … 00100 Inoue & Co. 85% 精度82%って 失敗じゃない?  アタックできる件数の最大の100件に絞り込み  100件のうち95件が実際にアップグレード ⇒精度95% 件数 絞り込み