Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20210126_AI・データ分析プロジェクトのすべて_ビジネスxテクノロジー=価値創出(パーソルさん向け)

 20210126_AI・データ分析プロジェクトのすべて_ビジネスxテクノロジー=価値創出(パーソルさん向け)

営業担当者に向けた本書の使い方の勉強会

Bc3d005a52243d2151ef2bc046464e0c?s=128

NobuakiOshiro

January 26, 2021
Tweet

More Decks by NobuakiOshiro

Other Decks in Business

Transcript

  1. NOB DATA株式会社 AI・データ分析プロジェクトの すべて 〜パーソルさん向け 勉強会資料(30p+α)〜 2021年1⽉26⽇ 代表取締役 ⼤城 信晃

  2. アジェンダ Copyright © 2020 NOB DATA All Rights Reserved. 1.

    ⾃⼰紹介 & はじめに 2. パーソル さん向けのセッション 3. 質疑応答
  3. アジェンダ Copyright © 2020 NOB DATA All Rights Reserved. 1.

    ⾃⼰紹介 & はじめに 2. パーソル さん向けのセッション 3. 質疑応答
  4. Copyright © 2020 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(@doradora09)

    NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会 九州⽀部 委員⻑ ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、 意思決定のためのデータ分析勉強会、他
  5. Copyright © 2020 NOB DATA All Rights Reserved. NOB DATA株式会社

    会社概要 企業情報 • 社名 ︓NOB DATA株式会社 • 設⽴年⽉⽇ ︓2018年9⽉ • 代表取締役 ︓⼤城信晃 • 所在地 ︓〒812-0013 福岡市博多区博多駅東2-5-19 サンライフ 第3ビル 6F • 事業内容 ︓データ活⽤に関するコンサルティング、受託分析、⼈材育成、セミナー、執筆など • Web : https://nobdata.co.jp/ ü AIプロジェクトのわからない、を同じ⽬線で解決するAI・データサイエンスの顧問集団 ü 10年来の分析仲間(副業)をネットワークしながらご⽀援を展開中 ü この2年間で⼤⼿から中⼩まで、約20社のデータ分析・AIプロジェクとのご⽀援を展開して きました
  6. Copyright © 2020 NOB DATA All Rights Reserved. DS協会の活動 九州⽀部(委員会)

    https://www.atpress.ne.jp/news/185882
  7. Copyright © 2020 NOB DATA All Rights Reserved. 今後の構想 DS47(仮)

    ・2021年は47都道府県のデータサイエンティストをネットワーク出来ないかを構想中 ・2020年のDS協会7thシンポジウムでは北海道〜沖縄まで7社の データサイエンティストとパネルディスカッションを実施
  8. Copyright © 2020 NOB DATA All Rights Reserved. NOB DATA株式会社

    特徴① ベテラン⼈材 ü リモート環境&副業を活かして、全国各地のベテランデータサイエンティストがご⽀援可能
  9. Copyright © 2020 NOB DATA All Rights Reserved. NOB DATA株式会社

    特徴② PJチーム育成 ü 分析プロジェクトチーム側に⽴ったアドバイスで円滑なプロジェクト推進を⽀援 ü NOB DATAと同じような分析を継続してできるようにするための⼈材育成・ノウハウ共有
  10. Copyright © 2020 NOB DATA All Rights Reserved. NOB DATAが⽬指す未来の⼀つ

    1. まず、各社でAI・データ分析プロジェクトが円滑に回る状態の構築 • ⼈材不⾜問題 -> 副業⼈材、協会活動(九州⽀部、DS47) • ビジネスノウハウ不⾜ -> 本書やアドバイザリーサービス 2. AI・データ分析による各社の業績UP & 実務経験を積んだ⾼度IT⼈材の輩出 3. 育った⼈材が今度はアドバイザーとして分析コミュニティに参画 & 各種業界全体の底上げ & 新規ビジネス創出 ü AI・分析⼈材のリソースが各企業・業種を循環するエコシステムの構築を⽬指す ü データ活⽤でより良いサービス、より良い働き⽅、より良いビジネス
  11. アジェンダ Copyright © 2020 NOB DATA All Rights Reserved. 1.

    ⾃⼰紹介 & はじめに 2. パーソル さん向けのセッション 3. 質疑応答
  12. Copyright © 2020 NOB DATA All Rights Reserved. d. パーソルさん向け勉強会⽤

    内容をざっと 1. 基礎知識としてのこの10年間(ビッグデータ、データサイエンス、AI、DX) ・デバイスの増加、データ量の増加、ストレージ低価格化、分析ツールの低価格化 2. そもそも、なぜ企業でデータ分析(・AI・DX)が必要なのか ・表⾯的な部分(の1つ): 効率化、競合への対抗、⼈材不⾜ ・本質的な部分(の1つ): テクノロジへの対応(変化⼒)、現場の視座の向上、データの価値 3. プロジェクト推進の際の注意ポイント ・えいやでやると⼤体失敗する(1000に3つ) ・アドバイザー or 有識者を⼊れると近道できる => 罠の回避⽅法は「AI・データ分析プロジェクトのすべて」をご参照 ・企業と専⾨家の「間を繋ぐ⼈材」の役割の重要性 ・ビジネストランスレーター •皆さんが担っている役割 4. NOB DATAのご⽀援の事例など ・⼝頭にて
  13. Copyright © 2020 NOB DATA All Rights Reserved. 1. 基礎知識としてのこの10年間

    ・様々な環境変化 ・デバイスの進化 ・データ蓄積コストの低下 ・通信の⾼速化 ・分析プラットフォームの低価格化・無料化 -> データサイエンティストの誕⽣(国内だと2012年頃、海外だと2009年頃) ・⼀部の企業から、IT企業、⾮IT企業への広がり ・2000年代以前︓スパコンや、⾦融機関、研究機関、宇宙開発など ・2000年代︓数⼗億の投資ができる企業(IT企業等。ヤフーなど) ・2010-15年頃︓データサイエンスブーム。無料でデータ分析ができる環境が整う。 AIの可能性を探索する時代。ゲーム系やIT企業が牽引。 ・2016-2020年頃︓東京を中⼼に試⾏錯誤。AI万能に関する幻想は消え始めたころ。 東京を中⼼として⾮IT企業にも広がり始める。 ・2021年(現在)〜︓地⽅の⾮IT企業にも広がりを⾒せる。名前がDXと変わったりしているが データ分析という観点では変わらず。 (むしろデジタル化からやろう、という意味合いが含まれている) AI⼈材の内製化の動きがあるが、メンターが不⾜ -> NOB DATAは主にここを⽀援
  14. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ①データ分析環境の変化(1/2)

    ・データの種類と量の爆発的な増加と活⽤(7-1節) -> ビッグデータ解析の前提となる環境が整ってきた(データは21世紀の⽯油、とも⾔われる) kB -> MB -> GB -> TB -> PB -> EB -> ZB …
  15. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ①データ分析環境の変化(2/2)

    ・もう⼀つの流れとして、圧倒的な研究開発費を背景とするGAFA系各種クラウド(1-2節) (10-4節)の 普及や分析⾔語・ライブラリの充実(7-3節)による、環境構築費⽤の⼤幅な低下 -> 数千万の投資が必要だったビッグデータ解析もクラウドを使えば数百円から始められるように
  16. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ②データサイエンティストの誕⽣(1/2)

    ・その結果、データサイエンティストの誕⽣(1-1節)と、スキルセット定義(2-1節)や⼈材育成の動き ・Tokyo.R(2010年〜)やPyData.Tokyo(2014年〜)など技術コミュニティも誕⽣
  17. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ③ビジネスメリットはどこにあるか(2/2)

    ・広告や⾦融業界などは1%予測精度が上がるだけで数⼗億円以上利益が出るケースも多い ・ECでもレコメンドエンジンの改善による売り上げUPなど、マッチング系のビジネスとも相性が良い ・⼀⽅で医療業界では法規制があるなど、業界によってビジネス適⽤の状況が全く異なる (事例は11章全般)
  18. Copyright © 2020 NOB DATA All Rights Reserved. 2. そもそも、なぜ企業でデータ分析(・AI・DX)が必要なのか

    表⾯的な部分 ・対競合 ・競合A社がAI技術に着⼿、⾃社も取り組まないと・・︕ ・対社内 ・働き⽅改⾰、業務効率化 ・必要に迫られて ・少⼦⾼齢化による労働⼒不⾜ 本質的な部分 ・変化への対応⼒(テクノロジ観点) ・⾺⾞ -> 蒸気機関 -> ガソリン⾞ -> 電気⾃動⾞ ・郵便 -> Eメール -> チャット ・固定電話 -> ガラケー -> スマホ ・社員の視座を上げ、⼀段上の提案を得る(ビジネス観点) ・データ分析は社内ヒエラルキーを横断できる ・共通⾔語としてのデータ ・国が統計 -> 経営層が分析 -> 社員が分析・提案 -> 全国⺠ ・データを会社の資産として蓄積 ・データは21世紀の⽯油。ただ溜めつつちゃんと使えるようにするのには数年かかる
  19. Copyright © 2020 NOB DATA All Rights Reserved. 参考① :

    業界によってニーズ(成否)が分かれている ・DS⼈材のニーズの⼤きな業界と、研究開発費の割合。業界によってビジネス価値を出せるかどうかは ⼤きく状況が異なる(データ取得コスト、ビジネス規模、再現性、施策実⾏可能性の掛け算) https://www.fnn.jp/articles/-/56285 https://note.com/shunkonya/n/nb6 4d032c8f71
  20. Copyright © 2020 NOB DATA All Rights Reserved. 参考② :

    ⼈材ニーズの8割は関東圏 ・最新技術はやはり東京が早い。海外 -> 東京 -> 主要都市圏 -> その他地⽅ ・単に「データサイエンティスト」の求⼈ベースだと8割は関東県 ・個⼈的には福岡と東京だと5年くらいギャップを感じる
  21. Copyright © 2020 NOB DATA All Rights Reserved. 参考③ :

    グローバルで⾒ると圧倒的にGAFA ・時価総額ベースだとアメリカの4社が国内の上場企業の合計を超える ・プラットフォーマーはもはや取れない。であればうまく彼らの製品を使っていくという発想が⼤事
  22. Copyright © 2020 NOB DATA All Rights Reserved. 3. プロジェクト推進の際の注意点

    ・全体的には本書参考のこと(PR) ・プロジェクトを待ち構える様々な罠 ・普通に何も考えずにやると1000に3つ ・成功率を上げる⽅法 ・できる、できない、トライの切り分け •要知識、経験 ・他社事例があるかどうか ・有識者をプロジェクトに⼊れる -> 10倍〜100倍くらい成功率が変わると思います (それでも10に3つ) -> 仮説を潰していくこと(狭めていくこと)にも価値が あるというスタンスが重要 ・企業と専⾨家を繋ぐ⼈材「ビジネストランスレーター」の 重要性
  23. Copyright © 2020 NOB DATA All Rights Reserved. よくあるプロジェクトを待ち構える罠(⼀例) 本書はAI・データ分析プロジェクトに潜む様々な罠とその対策を解説しています。

    プロジェクト経験者の皆さんなら何度も遭遇された事があるのではないでしょうか。 ①斬新すぎるテーマ選定 ↔ 期待値調整で対応 ②なんでもデータを集める ↔ ⼈が判断に使っているデータから集める ③分析経験者が不在 ↔ アドバイザーを雇って近道をする ④最後の施策実⾏フェーズで不発 ↔ 初期から実現可能性の検討
  24. Copyright © 2020 NOB DATA All Rights Reserved. AIという⾔葉を使わないで表現(理解)できるかどうか(1/2) ・AIという⾔葉に抱くイメージが各⾃の頭の中で違うため、認識合わせが重要(期待値調整とも)

    ・AI=ドラえもんができる︕と思ってる⼈もまだ結構いるはず ・売り⽂句としてのAIは使っても良いが、使う側・作る側はAIという⾔葉を使わないで表現できるこ とが望ましい(ex : 画像処理、 最適化、 etc..) AIと聞いて想起する内 容の例 提案する側としての認識 実現可能性とコスト 備考 ドラえもん ロボット & 汎⽤⼈⼯知能 & 空想。猫型ロボット。 実現可能性もコストも⽬ 処は⽴っていない。 認識があってないとまずい ケース。説得または撤退。 ⽐喩として使うとかならま だわかる SIRI、チャットボット ⾳声解析、テキスト解析、 ⼈⼝無脳、ルールベースの 応答システム、機械学習 ベースの応答システム パターンに対しては実現。 常識という概念はない、 意味を理解している訳で はない。コストは複雑な ものは結構かかる (100万〜数億以上) 基本はルールベース。常 識や意味を理解している わけではないので、業務 への部分適⽤かエンタメ 要素での利⽤を推奨。 RPA 単純作業の⾃動化プログ ラム パソコンを使うルーチン ワークなら実現。保守コ ストが膨らむケースがある ので注意。 (数百万〜数千 万︖) AIというかIT化、⾃動化。 とりあえずデジタル化の第 ⼀歩という⽂脈ならあり
  25. Copyright © 2020 NOB DATA All Rights Reserved. AIという⾔葉を使わないで表現(理解)できるかどうか(2/2) ・AIという⾔葉に抱くイメージが各⾃の頭の中で違うため、認識合わせが重要(期待値調整とも)

    ・AI=ドラえもんができる︕と思ってる⼈もまだ結構いるはず ・売り⽂句としてのAIは使っても良いが、使う側・作る側はAIという⾔葉を使わないで表現できるこ とが望ましい(ex : 画像処理、 最適化、 etc..) AIと聞いて想起する内 容の例 提案する側としての認識 実現可能性とコスト 備考 与信モデル、顔画像認識、 予兆検出 ルールベース、機械学習、 クラスタリング、画像処理、 IoT、時系列解析、相関 分析、etc.. 実現可能性はものによる。 通常データ分析やAI構 築の⽂脈で語られるもの はこちら。コストはカスタマ イズして作るとそこそこかか る (数百万〜数億) AIのモデル構築も⼤事だ が、ビジネスインパクトを考 慮してどの程度の精度な ら費⽤対効果に合うのか を初期に検討することも ⼤切(=出⼝戦略) アルファ碁 / アルファ碁ゼ ロ 機械学習、強化学習、 ディープラーニング等。最 先端の技術なら可能だが、 かなりの研究開発費⽤が 必要。精度に拘らなけれ ば技術を試すことは可能。 ⼀から作ろうとするとおそら く数⼗億以上、何かを流 ⽤すればもう少し安くなる かもだが機械学習・強化 学習等に必要なサーバー 代・電気代がかなりかかる 技術的なトライを許容す る企業であれば最新の技 術を試す余地はあり。た だ、⼀般的には簡単な分 析⼿法から試すほうが費 ⽤対効果は良くなる。 時代とともに新たな⼿法 が誕⽣し、さらにリーズナ ブルに使えるようになる (=コモディティ化)
  26. Copyright © 2020 NOB DATA All Rights Reserved. 企業と専⾨家の「間を繋ぐ⼈材」の役割の重要性 ・2015-2020年頃は結構事業会社がAIベンダーの⾷い物にされる

    ケースもちらほら -> AIに対する不信感 ・発注側にもスキルが必要 -> チームビルディングのニーズ ・メンターのニーズ ・ビジネスとの間を取り持つ⼈材のニーズ ・三井住友海上の⽊⽥さんのように 「ビジネストランスレーター」という呼び⽅をしている⼈たちもいる (画像は中川さんの書評より) -> ここは今後の皆さんも担えると強いかも・・︖ https://shinyorke.hatenablog.com/entry/business-translator
  27. Copyright © 2020 NOB DATA All Rights Reserved. 4. 事例関係

    ・⼝頭にて ・例 ・⼤⼿インフラ企業 ・不動産関連 ・電⼦カルテベンダー ・通信回線企業 ・建築系プラント企業 、などなど 課題ヒヤリング (1ヶ⽉⽬) 仮説検討・ 初期のアクション プランニング データ収集・ 基礎分析 PoC・効果測定 施策化・改善の 判断・テーマ選定 3〜6ヶ⽉で1サイクル
  28. アジェンダ Copyright © 2020 NOB DATA All Rights Reserved. 1.

    ⾃⼰紹介 & はじめに 2. パーソル さん向けのセッション 3. 質疑応答
  29. Copyright © 2020 NOB DATA All Rights Reserved. 補⾜︓読者フォローアップ会の企画中 ・⽉1くらいでこの本の読者向けのフォローアップ会を予定しています

    ・初回は1/26(⽕) 19:00-21:00(本⽇夜・・︕︕) ・NOB DATAのTech Playの以下のグループフォローしてもらえればページ出来次第ご案内が⾶ぶと 思いますので、お気軽にどうぞ https://techplay.jp/community/nobdata
  30. Copyright © 2020 NOB DATA All Rights Reserved. ご清聴、ありがとうございました・・︕︕

  31. Copyright © 2020 NOB DATA All Rights Reserved. 参考資料

  32. アジェンダ Copyright © 2020 NOB DATA All Rights Reserved. 1.

    ⾃⼰紹介 & はじめに 2. 本書の特徴・読み⽅ • 学⽣やこれから分析者を⽬指す⽅ • ジュニア or ミドル データサイエンティスト • 経営者や分析チームのマネージャー • DS教育を⾏う教員 3. 流れに沿って説明 • 準備編 • ⼊⼝編 • 実⾏編 • 出⼝編 4. ピックアップ 5. 補⾜情報
  33. Copyright © 2020 NOB DATA All Rights Reserved. 本書の特徴 ・これまであまり語られることのなかった「ビジネス」の観点も加えたAI・

    データ分析プロジェクトの解説書です ・プロジェクトに潜む様々な「罠」をある程度予⾒することが可能になりま す ・プロジェクトの⼊り⼝から出⼝まで、6名の⺠間企業やフリーランスとし て働くデータサイエンティストの共通認識を⼊れているので、実務におけ るAI・データ分析プロジェクト推進の⼀つの「型」としてご利⽤ください (研究者が書いた研究⽬線のデータサイエンス本とも異なります) ・なお基本広く浅く、書いてますので個々の技術の詳細は他書に譲る 形となっています。(個別の技術をしっかり学びたい⼈には物⾜りないか も。参考書籍は別途整理したいと思います)
  34. Copyright © 2020 NOB DATA All Rights Reserved. 全編にわたるビジネススキルの重要性の解説 例えば、経営層との期待値調整や外部AIベンダーの相場感、データを預かったらすぐ中⾝を確認するこ

    と、などの節は経験者にはあるある話ですが(テクノロジーの話ではないため)あえて語られる事は少ないか と思います(が、プロジェクト成功には不可⽋な要素です)
  35. Copyright © 2020 NOB DATA All Rights Reserved. よくあるプロジェクトを待ち構える罠(⼀例) 本書はAI・データ分析プロジェクトに潜む様々な罠とその対策を解説しています。

    プロジェクト経験者の皆さんなら何度も遭遇された事があるのではないでしょうか。 ①斬新すぎるテーマ選定 ↔ 期待値調整で対応 ②なんでもデータを集める ↔ ⼈が判断に使っているデータから集める ③分析経験者が不在 ↔ アドバイザーを雇って近道をする ④最後の施策実⾏フェーズで不発 ↔ 初期から実現可能性の検討
  36. Copyright © 2020 NOB DATA All Rights Reserved. 全体構成と他書との違い ・3の実⾏パートに関する書籍は多いが、その前後も含めて重要

    1.準備 2.⼊⼝ 3.実⾏ 4.出⼝ ü 多くの技術書はここを詳細に解説 ü AI開発・データ分析を実務・本業 にできない、という悩みに対するヒ ント ü 収益への貢献やビジネスメリットは 超⼤切 ü 結果を出さない分析チームはコス トセンターになり縮⼩へ ü 業界の基礎知識
  37. Copyright © 2020 NOB DATA All Rights Reserved. プロジェクトの⼊⼝(案件獲得)から出⼝(収益化)までの流れの俯瞰 個⼈的におすすめの読み⽅は、まず本の裏表紙を⾒て章単位で全体感の把握。(⼊⼝

    -> 出⼝の流れ) 次に⽬次を眺めて気になった節をピックアップして読み込む(⽬次だけでも⼤体わかる形になっています) 裏表紙で全体の流れを把握 ⽬次で節と⼩⾒出しを確認 1.準備 2.⼊⼝ 3.実⾏ 4.出⼝
  38. Copyright © 2020 NOB DATA All Rights Reserved. プロジェクトの⼊⼝(案件獲得)から出⼝(収益化)までの流れの俯瞰 ⽬次で節と⼩⾒出しを確認

    気になる節を精読 気になる節をみつけたら詳細を確認。 本書ではソースコードなどは基本的に出てこないため、⾮プログラマーの⽅でも読める内容となっています。
  39. Copyright © 2020 NOB DATA All Rights Reserved. 対象読者別のおすすめの章 ジュニアデータサイエンティストを中⼼として、AIやデータサイエンスのビジネス活⽤・プロジェクト推進に興

    味をお持ちの皆様(学⽣、ジュニア・ミドル・シニアDS、経営層、講師の⽴場の⽅など) ü ジュニア・データサイエンティスト前後 の⽅を中⼼に想定した構成 ü シニア・データサイエンティストは本書 の内容は⼀通り把握されている想定 (後進の育成や取引先への解説など にご活⽤ください) ü 分析チームの設⽴を考えている経営 層や、AI教育を⾏う教員の皆様に もおすすめの⼀冊です
  40. Copyright © 2020 NOB DATA All Rights Reserved. おすすめの章 ①学⽣・未経験者

    学⽣・データ分析プロジェクト未経験者には第1部準備編全部と、第3部実⾏の⼀部、第4部出 ⼝の12章「業界事例」 をお勧めします ü 2021年時点のデータサイエン ティストが置かれている状況を 把握 ü 必要なスキルセットを把握 ü 今後データ分析⼈材を⽬指す かの参考にする ü どの業界のデータ分析者を⽬指 すかを考える参考情報 (あくまで⼀例) 準 備 ⼊ ⼝ 実 ⾏ 出 ⼝ ü データの前処理、各種分析⼿ 法、RやPythonなどの⾔語、 クラウド技術などが実務のどの タイミングでどのような⽬的で⽤ いられるかの全体感を把握する
  41. Copyright © 2020 NOB DATA All Rights Reserved. おすすめの章 ②ジュニア・ミドルDS

    ジュニアDSには第3部の実⾏編を中⼼に、ミドルDSにはマネージメント観点を⼊れてその前後の部 (第2部⼊⼝編〜第4部出⼝編)をお勧めします。 ü 案件化に向けた動き ü データ管理や契約周りの⾜回り の整備(主にミドルDS向け) ü 業界別の出⼝戦略の検討 準 備 ⼊ ⼝ 実 ⾏ 出 ⼝ ü 何をするにもまずは先⾏事例の 調査 ü プロジェクト管理 (特に、ミドルDSの⽅) ü プロジェクト実⾏全般 (特に、ジュニアDSの⽅)
  42. Copyright © 2020 NOB DATA All Rights Reserved. おすすめの章 ③経営層・分析チームマネージャー

    これから⾃社にAIやDX、データ分析チームを⽴ち上げようと考えられている⽅はざっと全体的にご⼀読 いただく事をおすすめします。(特にチームビルディング関連) ü 分析チームの第1号案件をな ににするか ü データの管理⽅法 ü 業界別の出⼝戦略の検討 ü 投資対効果の検討 準 備 ⼊ ⼝ 実 ⾏ 出 ⼝ ü どのようなテーマに取り組むべき か ü どのような⼈材を集めるべきか ü (ご⾃⾝で実⾏はしない前提 で) 実際に分析チームが今後 想定されるタスクについて検討
  43. Copyright © 2020 NOB DATA All Rights Reserved. おすすめの章 ④教員

    これからAI⼈材を育成される教員の皆さんには全体的に俯瞰していただき、学術的に必要なスキル セット以外の、実ビジネスで必要なビジネススキルについて参考にしていただければと思います。 (これらは授業というより、学⽣⾃⾝が勉強会やインターンなどで経験を積む必要があります) ü (ここは後回しでもOK) ü 特にどの業界に強い学⽣を育成 するかの⼀つの参考として 準 備 ⼊ ⼝ 実 ⾏ 出 ⼝ ü 直近10年のAI⼈材ニーズの 変化から、今後を占う ü 変化の激しい分野であることの 確認 ü 授業で教えている各種分析⼿ 法やITスキルがどのように実務 に利⽤されているかの把握
  44. アジェンダ Copyright © 2020 NOB DATA All Rights Reserved. 1.

    ⾃⼰紹介 & はじめに 2. 本書の特徴・読み⽅ • 学⽣やこれから分析者を⽬指す⽅ • ジュニア or ミドル データサイエンティスト • 経営者や分析チームのマネージャー • DS教育を⾏う教員 3. 流れに沿って説明 • 準備編 • ⼊⼝編 • 実⾏編 • 出⼝編 4. ピックアップ 5. 補⾜情報
  45. Copyright © 2020 NOB DATA All Rights Reserved. 第1部 準備編

    概要 ・業界の概要、DSのスキルセットやキャリアパス、始め⽅、情報収集に関する内容がまとめられています
  46. Copyright © 2020 NOB DATA All Rights Reserved. 第2部 ⼊⼝編

    概要 ・プロジェクトの案件化の話からデータの取り扱いや他社との契約形体についてのプロジェクトがスタート するまでの段階の話が書かれています
  47. Copyright © 2020 NOB DATA All Rights Reserved. 第3部 実⾏編

    概要 ・プロジェクトが始まった後のプロジェクトマネジメントやデータ分析、レポーティングといったプロジェクトの 実⾏フェーズの話がまとめられています。
  48. Copyright © 2020 NOB DATA All Rights Reserved. 第4部 出⼝編

    概要 ・プロジェクトの出⼝戦略は最も重要な要素の⼀つと⾔っても過⾔ではありません。業界別の特徴を抑 えてどのように分析コストに⾒合う成果を出すか、といったヒントがまとめられています。
  49. アジェンダ Copyright © 2020 NOB DATA All Rights Reserved. 1.

    ⾃⼰紹介 & はじめに 2. 本書の特徴・読み⽅ • 学⽣やこれから分析者を⽬指す⽅ • ジュニア or ミドル データサイエンティスト • 経営者や分析チームのマネージャー • DS教育を⾏う教員 3. 流れに沿って説明 • 準備編 • ⼊⼝編 • 実⾏編 • 出⼝編 4. ピックアップ 5. 補⾜情報
  50. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ・①データ分析環境の変化

    ・②データサイエンティストの誕⽣ ・③ビジネスメリットはどこにあるか (・④「不確実性」とどう付き合うか) 以下、個別 ・a. みんなのPython勉強会 参加者向け ・b. OPEN Gʼs FUKUOKA #06
  51. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ①データ分析環境の変化(1/2)

    ・データの種類と量の爆発的な増加と活⽤(7-1節) -> ビッグデータ解析の前提となる環境が整ってきた(データは21世紀の⽯油、とも⾔われる) kB -> MB -> GB -> TB -> PB -> EB -> ZB …
  52. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ①データ分析環境の変化(2/2)

    ・もう⼀つの流れとして、圧倒的な研究開発費を背景とするGAFA系各種クラウド(1-2節) (10-4節)の 普及や分析⾔語・ライブラリの充実(7-3節)による、環境構築費⽤の⼤幅な低下 -> 数千万の投資が必要だったビッグデータ解析もクラウドを使えば数百円から始められるように
  53. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ②データサイエンティストの誕⽣(1/2)

    ・その結果、データサイエンティストの誕⽣(1-1節)と、スキルセット定義(2-1節)や⼈材育成の動き ・Tokyo.R(2010年〜)やPyData.Tokyo(2014年〜)など技術コミュニティも誕⽣
  54. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ②データサイエンティストの誕⽣(2/2)

    ・データサイエンティストが誕⽣して10年弱、専⾨化も進んできている(2-2節)が、依然経験重視、 かつコンサルとしてのビジネススキルも求められるため⽣存戦略(2-3節)を考える必要性はある
  55. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ③ビジネスメリットはどこにあるか(1/2)

    ・従来のITのように、単なる既存業務の⾃動化だけでなく、既存の業務フローの改善やグロースハック (11-2節)、施策の効果測定(8-1節、8-3)など投資判断の意思決定という⽂脈で⽤いられることも 多い ・また論⽂の執筆、学会発表(11-3節)、対外的なPR(11-4節)により知名度をUPさせ競合優位性 とする動きも⼀種のビジネスメリット
  56. Copyright © 2020 NOB DATA All Rights Reserved. ピックアップ ③ビジネスメリットはどこにあるか(2/2)

    ・広告や⾦融業界などは1%予測精度が上がるだけで数⼗億円以上利益が出るケースも多い ・ECでもレコメンドエンジンの改善による売り上げUPなど、マッチング系のビジネスとも相性が良い ・⼀⽅で医療業界では法規制があるなど、業界によってビジネス適⽤の状況が全く異なる (事例は11章全般)
  57. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け ・詳細URL ・https://startpython.connpass.com/event/198770/ ・タイトル『ビジネスとテクノロジーの掛け算』 ⼤城 信晃(NOB DATA株式会社 代表取締役社⻑) 伊藤 徹郎(Classi株式会社 データAI部部⻑) ・流れ ・はじめに & 本の説明 15min ・パネル with テツローさん & 質疑応答 15min
  58. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け ・もちろんベースとなる個別の課題に「技術⼒」も⼤事だが ・なぜ、「ビジネス⼒」が必要なのか => プロジェクトの⼊り⼝、出⼝戦略 •マネタイズ⼤事 => プロジェクトの実⾏フェーズでも⼤切 (不確実性が⾼いため) => この辺の内容をまとめた本を書きました。 ・参加者の⾊々なモチベーション ・学⽣の⽅ ・エンジニアの⽅ ・分析者の⽅ ・経営層の⽅、etc.. => AIやデータ分析プロジェクトについてご興味をお持ちの⽅は、 それぞれの⽴場で読んでいただけると幸いです
  59. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け ・TJOさんの書評 ・GOODなポイント : 実務を反映 ・⾜りない部分 : 参考書籍の充実 •今後の課題 -> フォローアップ会をやります (1/26 19:00-21:00予定) ・本書のご紹介、あとでパネルディスカッション
  60. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け ・Pythonに興味のあるエンジニアの⽅や、場合によっては学⽣さんもいらっしゃるかと思います ・AI・データ分析プロジェクトに興味のある⽅は以下の節をお勧めします(その1) ・1-3 従来のシステム開発とAIプロジェクトは何が違うのか -> これで完成、が無い ・1-4 PoCで終わらないためのAIプロジェクト⼊⾨ -> AIじゃないとダメかどうかをまず考える ・2-4 求⼈情報からわかること -> 未経験OK︕に要注意 ・4-1 データ分析組織の⾒極め -> 場合によっては転職も視野に⼊れる ・4-2 データ分析組織の⽴ち上げ -> 結構パワーが必要なケースも ・4-5 組織構造の把握 -> 根回し⼤事。プロジェクトに誰を巻き込むか︖ ・6-1 AI・データ分析プロジェクト設計の注意点 -> 不確実性と、⾼すぎる期待のコントロール ・6-4 KPIの設計と評価 -> たいていのプロジェクトにはKPIがあるので意識しておきましょう
  61. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け ・Pythonに興味のあるエンジニアの⽅や、場合によっては学⽣さんもいらっしゃるかと思います ・AI・データ分析プロジェクトに興味のある⽅は以下の節をお勧めします(その2) ・7-1 業界によるデータの種類とビジネスでの活⽤⽅法 -> 業界ごとの特徴を押さえましょう ・7-2 データの実情と前処理の⼤切さ -> Python⼤活躍 ・7-3 ツール・プログラミング⾔語の選択 -> Pythonも、それ以外も環境・⼈員に合わせて利⽤ ・7-4 ⽬的によるデータ分析⼿法の違い -> 様々な解析⼿法の基礎 ・8-1 効果測定の重要性 -> AI開発・分析PJを進める上で必須 ・8-4 A/BテストやA/Aテスト -> A/Aはちょっと聞き慣れないかも︖
  62. Copyright © 2020 NOB DATA All Rights Reserved. a. みんなのPython勉強会

    参加者向け ・Pythonに興味のあるエンジニアの⽅や、場合によっては学⽣さんもいらっしゃるかと思います ・AI・データ分析プロジェクトに興味のある⽅は以下の節をお勧めします(その2) ・9-1 分析結果のレポート化 -> 必須 ・9-2 データ分析から導くアクション -> アクション(意思決定)につながらない分析は価値を出しにくい ・9-4 中間テーブルを⽤いた効率化 -> SQL必須 ・10-1 データ基盤を作る前に考えること -> ショットの場合は作らなくて良い ・10-4 クラウドの選定 -> 基盤を作るとなったら検討 ・10-7 AI実運⽤のためのスキルセット -> DevOpsを拡張してMLOpsエンジニア ・11章のプロジェクトバリュー、12章の業界事例全般
  63. Copyright © 2020 NOB DATA All Rights Reserved. b. OPEN

    Gʼs FUKUOKA #06 向け • 1/14(⽊) 19:00 - 21:00 • https://open-gs-6.peatix.com/view
  64. Copyright © 2020 NOB DATA All Rights Reserved. b. OPEN

    Gʼs FUKUOKA #06 向け この辺を話す 誤解系 • AI万能説(もちろんそんなことは無い) • データサイエンティストは⽢くない(未経験OK! とかじゃない)よ、と⾔う話 (注意してね、と⾔ う話) 事例系 • いくつか過去の発表から紹介 • 本からの紹介(技術的な部分) 背景・基礎知識 • 時代背景、スキルセット • サイエンティスト との違い • なぜ⾼単価なんでしたっけ︖ • 現在おかれている環境(経験者じゃないと 結構⾟い) • 機械学習とは、従来の開発との違い プロジェクトイメージ • モデル開発 or ⾃動化 or 意思決定⽀援 • 従来のIT開発との違い • 8割は前処理(まで)の⼯程 キャリア系 • 段階的にキャリアアップするには︖ • そのなかのGʼsの使い⽅、Gʼs⽣向け(現業、転 職、起業) • データサイエンスはそんなに学べない点は補⾜ • ⼿を動かす⼤切さ、挑戦、⼈脈 • 他の⽅法 • ビジネストランスレーター (データプランナー) • 勉強会で発表 •個⼈的におすすめ • ⾃社内で⽴ち上げる • 副業は・・未経験者はあまりお勧めしない(が、 ケースバイケース) AI・DSの雰囲気を伝えつつも、あくまでイチ⼿段。 最終的に皆さんが解決したいこと、達成したいことはなんでしたっけ︖と⾔う話
  65. Copyright © 2020 NOB DATA All Rights Reserved. プログラミングを学ぶ⽬的別コメント 1.

    教養として • (仕事になるかは別として) どれかの⾔語を1つやっておくと概念は理解できるようになるので、オススメ 2. 部分的に使う場合 • 実⽤上は既存業務の改善の便利関数やツールを作るくらいから、と⾔うのも⼀⼿ (Excelでも正直OKかと) • 起業サイドの発注側の⽴場の場合、基礎知識としても役に⽴つと思います 3. 未経験からIT系の仕事にしたい場合(転職) • 数年〜数ヶ⽉おきに新しい⾔語やライブラリが出てくるので、学ぶだけでなく⾃分で⼿を動かすことが⼤ 事。⼟⽇は趣味で開発とか • 実務経験を3年も積めば⼤体⼀⼈で仕事できるようになるかと(基本はチーム開発。デザイン系は別) 4. 未経験からAIやデータ分析系の仕事にしたい場合は • 未経験者は基本雇われないので、どこかで実務経験を積むことをお勧め (その予備知識としてのスクールはあり、もちろん就職を保証するものではない) • 個⼈的にお勧めの⽅法はIT系の勉強会でLT等で毎⽉発表していれば、1­2年後にはどこかから声 かかると思うので「勉強会駆動学習」はお勧め 5. ITやAIで起業したい場合は • 5年後⽣存率15%の世界へようこそ。 • なおAI開発の場合はデータがない問題があるためさらに難易度⾼め => 何年打席に⽴てるかの観点からも、得意領域や資⾦的な余⼒、案件は⼤切
  66. Copyright © 2020 NOB DATA All Rights Reserved. AIに対する基礎認識チェック ・皆さんはAIと聞いて何を思い浮かべますか︖

    ・ドラえもん︖ ・アルファ碁︖ ・⾃動運転︖ ・AIエアコン︖ ・チャットボット・・︖ ・与信モデル︖ ・レコメンドエンジン︖
  67. Copyright © 2020 NOB DATA All Rights Reserved. AIに対する基礎認識チェック ・皆さんはAIと聞いて何を思い浮かべますか︖

    ・ドラえもん︖ ・アルファ碁︖ ・⾃動運転︖ ・AIエアコン︖ ・チャットボット・・︖ ・与信モデル︖ ・レコメンドエンジン︖ ・上記はいずれも広義のAIですが、 単に売りやすく名前をつけているだけの可能性もあるので AIサービスを作る側は違いを理解する必要があります(最低限以下くらいには) ・ドラえもん︖ => まだ空想の世界だけ。たまに勘違いしている⼈がいるがまだまだ実現していない ・アルファ碁︖ => ディープラーニング、強化学習等による学習済みモデル ・⾃動運転︖ => 画像処理やルールベースによる判断などを組み込んだ⼀分野 ・AIエアコン︖ => ITシステムのエアコンを単に名前を変えただけ(だと思う) ・チャットボット・・︖ => 多くはルールベースのITシステム。(AIと⾔いたいだけ) ・与信モデル︖ => 狭義のAI(⼈⼯知能)という意味では⼀番近い ・レコメンドエンジン︖ => これも狭義のAIの⼀つの応⽤形
  68. Copyright © 2020 NOB DATA All Rights Reserved. AI・データ分析を⽤いたプロダクト例 ・Web上より6個

    + 書籍よりいくつかご説明
  69. Copyright © 2020 NOB DATA All Rights Reserved. 例① :

    ⼝コミ分析 Webからのデータ収集 (APIやスクレイピング) テキスト解析・可視化 次の施策の 検討材料とする https://www.itmedia.co.jp/news/articles/1411/12/news089.html ・⼝コミデータを使った検索・感情分析サービス(ヤフー)
  70. Copyright © 2020 NOB DATA All Rights Reserved. 例② :

    選挙の当選予測 ・2016参院選, 91%正解(ヤフー) https://about.yahoo.co.jp/info/bigdata/election/2016/02/ 過去の当選結果と候補者指 名の検索クエリのデータ収集 相関関係の可視化やモデル 化 独⾃の選挙予測を出す(& 答え合わせ)
  71. Copyright © 2020 NOB DATA All Rights Reserved. 例③ :

    在宅予測 ・不要配送を92%削減(東⼤発ベンチャー等のチーム) スマートメーターのIoTデバイス 情報取得 曜⽇・時間帯の在宅確率を 算出・可視化 宅配の配送計画の最適化 https://www.fnn.jp/posts/00405230HDK
  72. Copyright © 2020 NOB DATA All Rights Reserved. 例④ :ソフトバンクの接続率No.1

    ・アプリの接続状況データの分析で効率的な電波接続状況の改善(ソフトバンク、2013年) (※当時はほぼ無名のAgoop、2021年現在は新型コロナで連⽇⼈流の参考値を提供) https://cloud.watch.impress.co.jp/docs/interview/611351.html
  73. Copyright © 2020 NOB DATA All Rights Reserved. 例⑤ :

    廃棄ロス75%減のスシロー http://www2.cgu.ac.jp/kyouin/takahashi/siryou/jouhou_syokugyou/sushiro.pdf ・回転寿司 x IoT x データ分析 = 価値創出
  74. Copyright © 2020 NOB DATA All Rights Reserved. 例⑥ :

    AIカメラのトライアル ・⼩売 x 画像解析 = 価値創出 https://www.nikkei.com/article/DGXMZO36179460V01C18A0962M00/
  75. Copyright © 2020 NOB DATA All Rights Reserved. その他にも、各業界での活⽤例 ・広告や⾦融業界などは1%予測精度が上がるだけで数⼗億円以上利益が出るケースも多い

    ・ECでもレコメンドエンジンの改善による売り上げUPなど、マッチング系のビジネスとも相性が良い ・⼀⽅で医療業界では法規制があるなど、業界によってビジネス適⽤の状況が全く異なる (事例は11章全般)
  76. Copyright © 2020 NOB DATA All Rights Reserved. 結局は何を解決したいかが⼤事 ・(細かいことは置いておいて)

    実務で使えれば個⼈的にはどれもOK ・ビジネスにおいてAI(やプログラミング)は⼿段であって、⽬的では無い ・ちなみに新規サービスの開発だけがAI開発・データ分析ではない(既存ビジネスのグロースハック等) ・なお、AIの予測・分類モデルは通常は精度は100%にはならない (100%だと基本的に過学習を起こしている状態なので、使えない) ・AI化するかどうか、どこまで精度をチューニングするかは基本的には費⽤対効果次第 (=ビジネスインパクト次第)(外注すると結構⾼いので)
  77. Copyright © 2020 NOB DATA All Rights Reserved. ちなみに︓求⼈の7-8割は東京圏に集中 ・本格的にやりたいなら東京も視野にいれるべき(競合も多いが)

  78. Copyright © 2020 NOB DATA All Rights Reserved. c. 意思決定のためのデータ分析勉強会⽤

    意思決定のための データ分析勉強会#11 LT 「データドリブンな組織⽂化醸成のための、AI・データ分析PJ⽴ち上げのススメ」
  79. Copyright © 2020 NOB DATA All Rights Reserved. データドリブンとは IUUQTXXXLFJEBOSFOPSKQQPMJDZ@TBOLPQEG

    データドリブンとは ・英語で「Data Driven」と表します。 売上データ、WEB 上での解析データなど、収集したデータの分析結果をもとにア クションを起こすことを意味します。 これまでにも、データに基 づくマーケティングは数多く実施されてきました。 メリット ・効率化ができる︕ ・他の⼈との意思疎通が早くなる(特に会議) ・業務のボトルネックが発⾒できる(思考⽅法が⾝に付く ) 、 など ⾔い換えると à 現場・組織全体がいわゆる「経営視点」を得られる
  80. Copyright © 2020 NOB DATA All Rights Reserved. ちょっとしたイベント集客での意思決定 ・本の出版でイベント集客︕

    ・課題感︓イベント集客ってどこで集めればいいんだっけ・・︖︖
  81. Copyright © 2020 NOB DATA All Rights Reserved. ちょっとしたイベント集客での意思決定 ・⾃社のイベントLP毎にクエリパラメータを付与

    ・どのチャネルでの集客にインパクトがあるのかをGoogle Analyticsで可視化 DS協会のML
  82. Copyright © 2020 NOB DATA All Rights Reserved. ご参考 :

    AI-Redy IUUQTXXXLFJEBOSFOPSKQQPMJDZ@TBOLPQEG
  83. Copyright © 2020 NOB DATA All Rights Reserved. よくある勘違い︓すべてAIでやらなきゃ・・︕ 少しずつ、必要な範囲をやると良いとおもいます

    課題発⾒ / 仮説構築 / モニタリング / PDCA 1. 紙 ↓ 2. Excel ↓ 3. BIツール ↓ 4. データ分析 ↓ 5. 機械学習・AI 社内にデータ分析チーム・プロジェクトを⽴ち上げて、 費⽤対効果に合う範囲でやることをおすすめ
  84. Copyright © 2020 NOB DATA All Rights Reserved. c. 意思決定のためのデータ分析勉強会

    向け(1/2) この辺の節をお勧めします・・︕ ・4-1 データサイエンス組織の⾒極め ・4-2 データ分析組織の⽴ち上げ ・4-3 社内案件の獲得⽅法から⾒ 積もりまでの流れ ・6-2 課題抽出 ・6-4 KPIの設計と評価 ・8-1 効果測定の重要性 ・9-1 分析結果のレポート化 ・9-2 データ分析から導くアクション ・9-3 データドリブンな⽂化構築を ⽬指す上で重要なBIツール ・11章全般︓プロジェクトのバ リューと継続性 ・12章全般︓業界別事例紹介
  85. Copyright © 2020 NOB DATA All Rights Reserved. c. 意思決定のためのデータ分析勉強会

    向け(2/2) この辺の節をお勧めします・・︕ ・基盤の運⽤周りの話もありますー ・9-4 中間テーブルを⽤いた効率化 ・10-2 データ基盤を作らずに済む⽅ 法を考える(その1) ・コラム︓メタデータの管理
  86. アジェンダ Copyright © 2020 NOB DATA All Rights Reserved. 1.

    ⾃⼰紹介 & はじめに 2. 本書の特徴・読み⽅ • 学⽣やこれから分析者を⽬指す⽅ • ジュニア or ミドル データサイエンティスト • 経営者や分析チームのマネージャー • DS教育を⾏う教員 3. 流れに沿って説明 • 準備編 • ⼊⼝編 • 実⾏編 • 出⼝編 4. ピックアップ 5. 補⾜情報
  87. Copyright © 2020 NOB DATA All Rights Reserved. 著者紹介①

  88. Copyright © 2020 NOB DATA All Rights Reserved. 著者紹介②

  89. Copyright © 2020 NOB DATA All Rights Reserved. ご参考︓TJOさんの書評 ・全般的に良いコメントと、参考書籍もっと欲しいというコメント頂いております

    ・詳細なレビュー、ありがとうございます・・︕︕(参考書籍はどこかで整備したいですね。) https://tjo.hatenablog.com /entry/2020/12/22/180000
  90. Copyright © 2020 NOB DATA All Rights Reserved. メモ︓今回は書いてないけどどこかで話したい内容 1.

    再現性の重要性と困難さ、そのための抽象化⼒ 2. バリバリの「データサイエンティスト」以外の関わり⽅、⽊⽥さんの⾔う「ビジネストランスレーター」 3. 現在のデータサイエンスは学問のための⼿法であって売り上げを上げる⼿法ではない (by サイバーエージェント 安井さん) 4. データサイエンティスト職の誕⽣以前と以後のエンジニアのキャリアパスの変化、そもそもなぜ⾼単価 なのか(スペシャリスト、ゼネラリスト、さらに経営層へのリーチ) 5. AIはイチ⼿段として捉えた際に、結局最終的にやりたいことはなんでしたっけ︖ 6. データ分析は理数系だとおもったら最後は⼈⽂系のスキル、というか⼈に⾏き着いた件について 7. ノウハウはデータサイエンティスト⼀⼈⼀⼈の頭の中に、ただ外からは評価されにくい (会社としての評価) 8. DSを⽬指す場合、他業種からのピボットが⼀番確実ではないか︖