Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20210113_AI・データ分析プロジェクトのすべて_ビジネスxテクノロジー=価値創出(みんなのPython勉強会向け)

 20210113_AI・データ分析プロジェクトのすべて_ビジネスxテクノロジー=価値創出(みんなのPython勉強会向け)

NobuakiOshiro

January 14, 2021
Tweet

More Decks by NobuakiOshiro

Other Decks in Technology

Transcript

  1. Copyright © 2020 NOB DATA All Rights Reserved. 本⽇のアジェンダ ・本⽇の流れ

    (30min, 19:10-19:40) ・はじめに & 本の説明 15min (⼤城) ・パネルディスカッション & 質疑応答 15min (⼤城 & テツローさん) ・登壇者 ⼤城 信晃(NOB DATA株式会社 代表取締役社⻑) 伊藤 徹郎(Classi株式会社 データAI部部⻑) ・詳細URL ・https://startpython.connpass.com/event/198770/
  2. Copyright © 2020 NOB DATA All Rights Reserved. 本⽇のアジェンダ ・本⽇の流れ

    (30min, 19:10-19:40) ・はじめに & 本の説明 15min (⼤城) (19:10-19:25) ・パネルディスカッション & 質疑応答 15min (⼤城 & テツローさん) ・登壇者 ⼤城 信晃(NOB DATA株式会社 代表取締役社⻑) 伊藤 徹郎(Classi株式会社 データAI部部⻑) ・詳細URL ・https://startpython.connpass.com/event/198770/
  3. Copyright © 2020 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(@doradora09)

    NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会 九州⽀部 委員⻑ ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、 意思決定のためのデータ分析勉強会、他
  4. Copyright © 2020 NOB DATA All Rights Reserved. 本⽇は書籍の内容紹介と、パネルディスカッション ・2020/12/21に出版した「AI・データ分析プロジェクトのすべ

    て」のPRを兼ねて、こちらの内容を中⼼にお話しさせてください (著者として私と、伊藤さんをお呼びしています) ・質疑応答はsil.doにてパネルディスカッションの際に回答できれば と思います(時間たりなければ懇親会にて) ・sli.do https://bit.ly/stapy65question ・別途、⽉1くらいで読者フォローアップの勉強会も予定しておりま す。公開はまだですが初回を1/26(⽕) 19:00-21:00の予定。 (tech playのNOB DATAコミュニティご参照ください) https://techplay.jp/community/nobdata
  5. Copyright © 2020 NOB DATA All Rights Reserved. 余談①︓TJOさんにほめられた・・︕&増刷決定︕ ・レビュー、ありがとうございます・・︕

    ・宿題として頂いた参考書籍の充実は、読者フォローアップで対応検討しますね https://tjo.hatenablog.com/entry/2020/12/22/180000
  6. Copyright © 2020 NOB DATA All Rights Reserved. 本⽇のお話しサマリ ・Pythonの得意分野の⼀つとしてのAI開発・データ分析

    <-> ( サービス開発 ) => AI開発やデータ分析に興味をお持ちの⽅へのセッション (⾮エンジニア含む) => 学⽣、データ分析初⼼者、データサイエンティスト、経営 層、教員、etc.. ・どのようなプロジェクトも成功するに越したことは無い ・成功すれば、売り上げが上がり、技術も⾝につき、組織も拡 ⼤できる ・⼀⽅で、失敗を繰り返すと、コストがかさみ、AI・分析チーム も解散の危機に・・ (よくある) ・「ビジネス」観点はこれまで秘伝のタレだった => 本書ではプロジェクトに潜む罠の回避術・ノウハウを記載 ビジネスとテクノロジーの掛け算で価値を創出
  7. Copyright © 2020 NOB DATA All Rights Reserved. よくあるプロジェクトを待ち構える罠(⼀例) 本書はAI・データ分析プロジェクトに潜む様々な罠とその対策を解説しています。

    プロジェクト経験者の皆さんなら何度も遭遇された事があるのではないでしょうか。 ①斬新すぎるテーマ選定 ↔ 期待値調整で対応 ②なんでもデータを集める ↔ ⼈が判断に使っているデータから集める ③分析経験者が不在 ↔ アドバイザーを雇って近道をする ④最後の施策実⾏フェーズで不発 ↔ 初期から実現可能性の検討
  8. Copyright © 2020 NOB DATA All Rights Reserved. 結構泥臭いけど⼤事な部分も記載(ビジネス観点) 例えば、経営層との期待値調整や外部AIベンダーの相場感、データを預かったらすぐ中⾝を確認するこ

    と、などの節は経験者にはあるある話ですが(テクノロジーの話ではないため)あえて語られる事は少ないか と思います(が、プロジェクト成功には不可⽋な要素です)
  9. Copyright © 2020 NOB DATA All Rights Reserved. 全体構成と他書との違い ・3の実⾏パートに関する書籍は多いが、その前後も含めて重要

    1.準備 2.⼊⼝ 3.実⾏ 4.出⼝ ü 多くの技術書はここを詳細に解説 ü AI開発・データ分析を実務・本業 にできない、という悩みに対するヒ ント ü 収益への貢献やビジネスメリットは 超⼤切 ü 結果を出さない分析チームはコス トセンターになり縮⼩へ ü 業界の基礎知識
  10. Copyright © 2020 NOB DATA All Rights Reserved. プロジェクトの⼊⼝(案件獲得)から出⼝(収益化)までの流れの俯瞰 個⼈的におすすめの読み⽅は、まず本の裏表紙を⾒て章単位で全体感の把握。(⼊⼝

    -> 出⼝の流れ) 次に⽬次を眺めて気になった節をピックアップして読み込む(⽬次だけでも⼤体わかる形になっています) 裏表紙で全体の流れを把握 ⽬次で節と⼩⾒出しを確認 1.準備 2.⼊⼝ 3.実⾏ 4.出⼝
  11. Copyright © 2020 NOB DATA All Rights Reserved. プロジェクトの⼊⼝(案件獲得)から出⼝(収益化)までの流れの俯瞰 ⽬次で節と⼩⾒出しを確認

    気になる節を精読 気になる節をみつけたら詳細を確認。 本書ではソースコードなどは基本的に出てこないため、⾮プログラマーの⽅でも読める内容となっています。
  12. Copyright © 2020 NOB DATA All Rights Reserved. 対象読者別のおすすめの章 ジュニアデータサイエンティストを中⼼として、AIやデータサイエンスのビジネス活⽤・プロジェクト推進に興

    味をお持ちの皆様(学⽣、ジュニア・ミドル・シニアDS、経営層、講師の⽴場の⽅など) ü ジュニア・データサイエンティスト前後 の⽅を中⼼に想定した構成 ü シニア・データサイエンティストは本書 の内容は⼀通り把握されている想定 (後進の育成や取引先への解説など にご活⽤ください) ü 分析チームの設⽴を考えている経営 層や、AI教育を⾏う教員の皆様に もおすすめの⼀冊です
  13. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け(1/3) ・Pythonに興味のあるエンジニアの⽅や、場合によっては学⽣さんもいらっしゃるかと思います ・AI・データ分析プロジェクトに興味のある⽅は以下の節をお勧めします(その1) ・1-3 従来のシステム開発とAIプロジェクトは何が違うのか -> これで完成、が無い ・1-4 PoCで終わらないためのAIプロジェクト⼊⾨ -> AIじゃないとダメかどうかをまず考える ・2-4 求⼈情報からわかること -> 未経験OK︕に要注意 ・4-1 データ分析組織の⾒極め -> 場合によっては転職も視野に⼊れる ・4-2 データ分析組織の⽴ち上げ -> 結構パワーが必要なケースも ・4-5 組織構造の把握 -> 根回し⼤事。プロジェクトに誰を巻き込むか︖ ・6-1 AI・データ分析プロジェクト設計の注意点 -> 不確実性と、⾼すぎる期待のコントロール ・6-4 KPIの設計と評価 -> たいていのプロジェクトにはKPIがあるので意識しておきましょう
  14. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け(2/3) ・Pythonに興味のあるエンジニアの⽅や、場合によっては学⽣さんもいらっしゃるかと思います ・AI・データ分析プロジェクトに興味のある⽅は以下の節をお勧めします(その2) ・7-1 業界によるデータの種類とビジネスでの活⽤⽅法 -> 業界ごとの特徴を押さえましょう ・7-2 データの実情と前処理の⼤切さ -> Python⼤活躍 ・7-3 ツール・プログラミング⾔語の選択 -> Pythonも、それ以外も環境・⼈員に合わせて利⽤ ・7-4 ⽬的によるデータ分析⼿法の違い -> 様々な解析⼿法の基礎 ・8-1 効果測定の重要性 -> AI開発・分析PJを進める上で必須 ・8-4 A/BテストやA/Aテスト -> A/Aはちょっと聞き慣れないかも︖
  15. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け(3/3) ・Pythonに興味のあるエンジニアの⽅や、場合によっては学⽣さんもいらっしゃるかと思います ・AI・データ分析プロジェクトに興味のある⽅は以下の節をお勧めします(その3) ・9-1 分析結果のレポート化 -> 必須 ・9-2 データ分析から導くアクション -> アクション(意思決定)につながらない分析は価値を出しにくい ・9-4 中間テーブルを⽤いた効率化 -> SQL必須 ・10-1 データ基盤を作る前に考えること -> ショットの場合は作らなくて良い ・10-4 クラウドの選定 -> 基盤を作るとなったら検討 ・10-7 AI実運⽤のためのスキルセット -> DevOpsを拡張してMLOpsエンジニア ・11章のプロジェクトバリュー、12章の業界事例全般
  16. Copyright © 2020 NOB DATA All Rights Reserved. おすすめの章 ①学⽣・未経験者

    学⽣・データ分析プロジェクト未経験者には第1部準備編全部と、第3部実⾏の⼀部、第4部出 ⼝の12章「業界事例」 をお勧めします ü 2021年時点のデータサイエン ティストが置かれている状況を 把握 ü 必要なスキルセットを把握 ü 今後データ分析⼈材を⽬指す かの参考にする ü どの業界のデータ分析者を⽬指 すかを考える参考情報 (あくまで⼀例) 準 備 ⼊ ⼝ 実 ⾏ 出 ⼝ ü データの前処理、各種分析⼿ 法、RやPythonなどの⾔語、 クラウド技術などが実務のどの タイミングでどのような⽬的で⽤ いられるかの全体感を把握する
  17. Copyright © 2020 NOB DATA All Rights Reserved. おすすめの章 ②ジュニア・ミドルDS

    ジュニアDSには第3部の実⾏編を中⼼に、ミドルDSにはマネージメント観点を⼊れてその前後の部 (第2部⼊⼝編〜第4部出⼝編)をお勧めします。 ü 案件化に向けた動き ü データ管理や契約周りの⾜回り の整備(主にミドルDS向け) ü 業界別の出⼝戦略の検討 準 備 ⼊ ⼝ 実 ⾏ 出 ⼝ ü 何をするにもまずは先⾏事例の 調査 ü プロジェクト管理 (特に、ミドルDSの⽅) ü プロジェクト実⾏全般 (特に、ジュニアDSの⽅)
  18. Copyright © 2020 NOB DATA All Rights Reserved. おすすめの章 ③経営層・分析チームマネージャー

    これから⾃社にAIやDX、データ分析チームを⽴ち上げようと考えられている⽅はざっと全体的にご⼀読 いただく事をおすすめします。(特にチームビルディング関連) ü 分析チームの第1号案件をな ににするか ü データの管理⽅法 ü 業界別の出⼝戦略の検討 ü 投資対効果の検討 準 備 ⼊ ⼝ 実 ⾏ 出 ⼝ ü どのようなテーマに取り組むべき か ü どのような⼈材を集めるべきか ü (ご⾃⾝で実⾏はしない前提 で) 実際に分析チームが今後 想定されるタスクについて検討
  19. Copyright © 2020 NOB DATA All Rights Reserved. おすすめの章 ④教員

    これからAI⼈材を育成される教員の皆さんには全体的に俯瞰していただき、学術的に必要なスキル セット以外の、実ビジネスで必要なビジネススキルについて参考にしていただければと思います。 (これらは授業というより、学⽣⾃⾝が勉強会やインターンなどで経験を積む必要があります) ü (ここは後回しでもOK) ü 特にどの業界に強い学⽣を育成 するかの⼀つの参考として 準 備 ⼊ ⼝ 実 ⾏ 出 ⼝ ü 直近10年のAI⼈材ニーズの 変化から、今後を占う ü 変化の激しい分野であることの 確認 ü 授業で教えている各種分析⼿ 法やITスキルがどのように実務 に利⽤されているかの把握
  20. Copyright © 2020 NOB DATA All Rights Reserved. 第1部 準備編

    概要 ・業界の概要、DSのスキルセットやキャリアパス、始め⽅、情報収集に関する内容がまとめられています
  21. Copyright © 2020 NOB DATA All Rights Reserved. 第2部 ⼊⼝編

    概要 ・プロジェクトの案件化の話からデータの取り扱いや他社との契約形体についてのプロジェクトがスタート するまでの段階の話が書かれています
  22. Copyright © 2020 NOB DATA All Rights Reserved. 第3部 実⾏編

    概要 ・プロジェクトが始まった後のプロジェクトマネジメントやデータ分析、レポーティングといったプロジェクトの 実⾏フェーズの話がまとめられています。
  23. Copyright © 2020 NOB DATA All Rights Reserved. 第4部 出⼝編

    概要 ・プロジェクトの出⼝戦略は最も重要な要素の⼀つと⾔っても過⾔ではありません。業界別の特徴を抑 えてどのように分析コストに⾒合う成果を出すか、といったヒントがまとめられています。
  24. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ・①データ分析環境の変化

    ・②データサイエンティストの誕⽣ ・③ビジネスメリットはどこにあるか (・④「不確実性」とどう付き合うか) 以下、個別 ・a. みんなのPython勉強会 参加者向け
  25. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ①データ分析環境の変化(1/2)

    ・データの種類と量の爆発的な増加と活⽤(7-1節) -> ビッグデータ解析の前提となる環境が整ってきた(データは21世紀の⽯油、とも⾔われる) kB -> MB -> GB -> TB -> PB -> EB -> ZB …
  26. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ①データ分析環境の変化(2/2)

    ・もう⼀つの流れとして、圧倒的な研究開発費を背景とするGAFA系各種クラウド(1-2節) (10-4節)の 普及や分析⾔語・ライブラリの充実(7-3節)による、環境構築費⽤の⼤幅な低下 -> 数千万の投資が必要だったビッグデータ解析もクラウドを使えば数百円から始められるように
  27. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ②データサイエンティストの誕⽣(1/2)

    ・その結果、データサイエンティストの誕⽣(1-1節)と、スキルセット定義(2-1節)や⼈材育成の動き ・Tokyo.R(2010年〜)やPyData.Tokyo(2014年〜)など技術コミュニティも誕⽣
  28. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ②データサイエンティストの誕⽣(2/2)

    ・データサイエンティストが誕⽣して10年弱、専⾨化も進んできている(2-2節)が、依然経験重視、 かつコンサルとしてのビジネススキルも求められるため⽣存戦略(2-3節)を考える必要性はある
  29. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ③ビジネスメリットはどこにあるか(1/2)

    ・従来のITのように、単なる既存業務の⾃動化だけでなく、既存の業務フローの改善やグロースハック (11-2節)、施策の効果測定(8-1節、8-3)など投資判断の意思決定という⽂脈で⽤いられることも 多い ・また論⽂の執筆、学会発表(11-3節)、対外的なPR(11-4節)により知名度をUPさせ競合優位性 とする動きも⼀種のビジネスメリット
  30. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ③ビジネスメリットはどこにあるか(2/2)

    ・広告や⾦融業界などは1%予測精度が上がるだけで数⼗億円以上利益が出るケースも多い ・ECでもレコメンドエンジンの改善による売り上げUPなど、マッチング系のビジネスとも相性が良い ・⼀⽅で医療業界では法規制があるなど、業界によってビジネス適⽤の状況が全く異なる (事例は11章全般)
  31. Copyright © 2020 NOB DATA All Rights Reserved. 本⽇のアジェンダ ・本⽇の流れ

    (30min, 19:10-19:40) ・はじめに & 本の説明 15min (⼤城) ・パネルディスカッション & 質疑応答 15min (⼤城 & テツローさん) (19:25-19:40) ・登壇者 ⼤城 信晃(NOB DATA株式会社 代表取締役社⻑) 伊藤 徹郎(Classi株式会社 データAI部部⻑) ・詳細URL ・https://startpython.connpass.com/event/198770/
  32. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け ・パネルディスカッション ・本⽇は著者の⼀⼈である伊藤徹郎さんも来ていただいています ・伊藤さんは主に8章分析結果の評価と改善、11章プロジェクトのバリューと継続性全般、 2章のスキルセット・キャリアパスなどを執筆していただきました ・パネルテーマ (10min) ・テツローさんお勧めの節 ・プロジェクトでのPythonの使い所 ・その他 ・質疑応答 (5min) ・sli.do https://bit.ly/stapy65question
  33. Copyright © 2020 NOB DATA All Rights Reserved. 補⾜︓読者フォローアップ会の企画中 ・⽉1くらいでこの本の読者向けのフォローアップ会を予定しています

    ・初回は1/26(⽕) 19:00-21:00の予定 (ページ作成はこれから) ・NOB DATAのTech Playの以下のグループフォローしてもらえればページ出来次第 ご案内が⾶ぶと思いますので、お気軽にどうぞ https://techplay.jp/community/nobdata