Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20210114_OPEN G's #06 プログラミング初心者が陥る AIについての誤解とは? 〜データを活用したサービス開発〜【入門編】(OPEN Gs福岡セミナー)

20210114_OPEN G's #06 プログラミング初心者が陥る AIについての誤解とは? 〜データを活用したサービス開発〜【入門編】(OPEN Gs福岡セミナー)

NobuakiOshiro

January 14, 2021
Tweet

More Decks by NobuakiOshiro

Other Decks in Business

Transcript

  1. NOB DATA株式会社
    2021年1⽉14⽇
    代表取締役 ⼤城 信晃

    View Slide

  2. アジェンダ
    Copyright © 2020 NOB DATA All Rights Reserved.
    メインセッション 19:15 – 20:15
    • オープニング & ⾃⼰紹介(⼤城、皆さん) 15min
    • 本編 45min
    1. 本⽇お伝えしたいこと & 本の紹介 10min
    2. AIに対する認識の確認 & 事例 10min
    3. 業界背景とスキルセット 10min
    4. 実際のAI・データ分析プロジェクトのイメージ 10min
    5. まとめと皆さんのネクストアクション 5min
    質問セッション 20:15 – 20:30 (or 20:45)
    • 質疑応答 15〜30min

    View Slide

  3. アジェンダ
    Copyright © 2020 NOB DATA All Rights Reserved.
    メインセッション 19:15 – 20:15
    • オープニング & ⾃⼰紹介(⼤城、皆さん) 15min
    • 本編 45min
    1. 本⽇お伝えしたいこと & 本の紹介 10min
    2. AIに対する認識の確認 & 事例 10min
    3. 業界背景とスキルセット 10min
    4. 実際のAI・データ分析プロジェクトのイメージ 10min
    5. まとめと皆さんのネクストアクション 5min
    質問セッション 20:15 – 20:30 (or 20:45)
    • 質疑応答 15〜30min

    View Slide

  4. Copyright © 2020 NOB DATA All Rights Reserved.
    ⾃⼰紹介
    ⼤城信晃(@doradora09)
    NOB DATA株式会社 代表取締役社⻑ /
    データサイエンティスト協会 九州⽀部 委員⻑
    ・住まい
    沖縄 -> 東京 -> 福岡
    ・職歴
    ヤフー-> DATUM STUDIO ->
    LINE Fukuoka -> NOB DATA(株) 創業
    ・運営コミュニティ
    ・Tokyo.R(2010-2016)
    ・fukuoka.R、PyData.Fukuoka、
    意思決定のためのデータ分析勉強会、他
    ・Gʼsではスポットで講義をしています
    (メンターは直近は休業中)

    View Slide

  5. Copyright © 2020 NOB DATA All Rights Reserved.
    NOB DATA株式会社 会社概要
    企業情報
    • 社名 ︓NOB DATA株式会社
    • 設⽴年⽉⽇ ︓2018年9⽉
    • 代表取締役 ︓⼤城信晃
    • 所在地 ︓〒812-0013 福岡市博多区博多駅東2-5-19 サンライフ 第3ビル 6F
    • 事業内容 ︓データ活⽤に関するコンサルティング、受託分析、⼈材育成、セミナー、執筆など
    • Web : https://nobdata.co.jp/
    ü AIプロジェクトのわからない、を同じ⽬線で解決するAI・データサイエンスの顧問集団
    ü 10年来の分析仲間(副業)をネットワークしながらご⽀援を展開中
    ü この2年間で⼤⼿から中⼩まで、約20社のデータ分析・AIプロジェクとのご⽀援を展開して
    きました

    View Slide

  6. Copyright © 2020 NOB DATA All Rights Reserved.
    NOB DATA株式会社 特徴① ベテラン⼈材
    ü リモート環境&副業を活かして、全国各地のベテランデータサイエンティストと連携して運営

    View Slide

  7. Copyright © 2020 NOB DATA All Rights Reserved.
    DS協会の活動 九州⽀部(委員会)
    https://www.atpress.ne.jp/news/185882

    View Slide

  8. Copyright © 2020 NOB DATA All Rights Reserved.
    本⽇の参加者の皆さんの⾃⼰紹介タイム
    ・匿名でもOKです
    ・今回参加された⽬的や、プログラミングに関するモチベーション部分をお伺いしたいです
    (お⼀⼈10-20秒程度で)

    View Slide

  9. Copyright © 2020 NOB DATA All Rights Reserved.
    プログラミングを学ぶ⽬的別コメント
    1. 教養として
    • (仕事になるかは別として) どれかの⾔語を1つやっておくと概念は理解できるようになるので、オススメ
    2. 部分的に使う場合
    • 実⽤上は既存業務の改善の便利関数やツールを作るくらいから、と⾔うのも⼀⼿
    (Excelでも正直OKかと)
    • 起業サイドの発注側の⽴場の場合、基礎知識としても役に⽴つと思います
    3. 未経験からIT系の仕事にしたい場合(転職)
    • 数年〜数ヶ⽉おきに新しい⾔語やライブラリが出てくるので、学ぶだけでなく⾃分で⼿を動かすことが⼤
    事。⼟⽇は趣味で開発とか
    • 実務経験を3年も積めば⼤体⼀⼈で仕事できるようになるかと(基本はチーム開発。デザイン系は別)
    4. 未経験からAIやデータ分析系の仕事にしたい場合は
    • 未経験者は基本雇われないので、どこかで実務経験を積むことをお勧め
    (その予備知識としてのスクールはあり、もちろん就職を保証するものではない)
    • 個⼈的にお勧めの⽅法はIT系の勉強会でLT等で毎⽉発表していれば、1­2年後にはどこかから声
    かかると思うので「勉強会駆動学習」はお勧め
    5. ITやAIで起業したい場合は
    • 5年後⽣存率15%の世界へようこそ。
    • なおAI開発の場合はデータがない問題があるためさらに難易度⾼め
    => 何年打席に⽴てるかの観点からも、得意領域や資⾦的な余⼒、案件は⼤切

    View Slide

  10. アジェンダ
    Copyright © 2020 NOB DATA All Rights Reserved.
    メインセッション 19:15 – 20:15
    • オープニング & ⾃⼰紹介(⼤城、皆さん) 15min
    • 本編 45min
    1. 本⽇お伝えしたいこと & 本の紹介 10min
    2. AIに対する認識の確認 & 事例 10min
    3. 業界背景とスキルセット 10min
    4. 実際のAI・データ分析プロジェクトのイメージ 10min
    5. まとめと皆さんのネクストアクション 5min
    質問セッション 20:15 – 20:30 (or 20:45)
    • 質疑応答 15〜30min

    View Slide

  11. Copyright © 2020 NOB DATA All Rights Reserved.
    本⽇お伝えしたいこと
    この辺をピックアップしてお伝え
    誤解系
    • AI万能説(もちろんそんなことは無い)
    • データサイエンティストは⽢くない(未経験OK!
    とかじゃない)よ、と⾔う話 (注意してね、と⾔
    う話)
    事例系
    • いくつか過去の発表から紹介
    • 本からの紹介(技術的な部分)
    背景・基礎知識
    • 時代背景、スキルセット
    • サイエンティスト との違い
    • なぜ⾼単価なんでしたっけ︖
    • 現在おかれている環境
    (経験者じゃないと結構⾟い)
    • 機械学習とは、従来の開発との違い
    プロジェクトイメージ
    • モデル開発 or ⾃動化 or 意思決定⽀援
    • 従来のIT開発との違い
    • 8割は前処理(まで)の⼯程
    キャリア系
    • 段階的にキャリアアップするには︖
    • そのなかのGʼsの使い⽅、Gʼs⽣向け(現業、転
    職、起業)
    • データサイエンスはそんなに学べない点は補⾜
    • ⼿を動かす⼤切さ、挑戦、⼈脈
    • 他の⽅法
    • ビジネストランスレーター (データプランナー)
    • 勉強会で発表 ●個⼈的におすすめ
    • ⾃社内で⽴ち上げる
    • 副業は・・未経験者はあまりお勧めしない
    (が、ケースバイケース)
    AI・DSの雰囲気をお伝え。あくまでイチ⼿段。
    今後最終的に皆さんが解決したいこと、達成したいことにプログラミングが活きてくるかどうか

    View Slide

  12. Copyright © 2020 NOB DATA All Rights Reserved.
    書籍説明
    ・2020/12/21に発売した「AI・データ分析プロジェクトのすべて 〜ビジネス⼒x技術⼒=価値創出
    〜」より引⽤して本⽇はお話を進めていきます。
    ・ざっと概要をご説明

    View Slide

  13. Copyright © 2020 NOB DATA All Rights Reserved.
    著者紹介①

    View Slide

  14. Copyright © 2020 NOB DATA All Rights Reserved.
    著者紹介②

    View Slide

  15. Copyright © 2020 NOB DATA All Rights Reserved.
    本書の特徴
    ・これまであまり語られることのなかった「ビジネス」の観点も加えたAI・
    データ分析プロジェクトの解説書です
    ・プロジェクトに潜む様々な「罠」をある程度予⾒することが可能になりま

    ・プロジェクトの⼊り⼝から出⼝まで、6名の⺠間企業やフリーランスとし
    て働くデータサイエンティストの共通認識を⼊れているので、実務におけ
    るAI・データ分析プロジェクト推進の⼀つの「型」としてご利⽤ください
    (研究者が書いた研究⽬線のデータサイエンス本とも異なります)
    ・なお基本広く浅く、書いてますので個々の技術の詳細は他書に譲る
    形となっています。(個別の技術をしっかり学びたい⼈には物⾜りないか
    も。参考書籍は別途整理したいと思います)

    View Slide

  16. Copyright © 2020 NOB DATA All Rights Reserved.
    全編にわたるビジネススキルの重要性の解説
    例えば、経営層との期待値調整や外部AIベンダーの相場感、データを預かったらすぐ中⾝を確認するこ
    と、などの節は経験者にはあるある話ですが(テクノロジーの話ではないため)あえて語られる事は少ないか
    と思います(が、プロジェクト成功には不可⽋な要素です)

    View Slide

  17. Copyright © 2020 NOB DATA All Rights Reserved.
    よくあるプロジェクトを待ち構える罠(⼀例)
    本書はAI・データ分析プロジェクトに潜む様々な罠とその対策を解説しています。
    プロジェクト経験者の皆さんなら何度も遭遇された事があるのではないでしょうか。
    ①斬新すぎるテーマ選定 ↔
    期待値調整で対応
    ②なんでもデータを集める ↔
    ⼈が判断に使っているデータから集める
    ③分析経験者が不在 ↔
    アドバイザーを雇って近道をする
    ④最後の施策実⾏フェーズで不発 ↔
    初期から実現可能性の検討

    View Slide

  18. Copyright © 2020 NOB DATA All Rights Reserved.
    全体構成と他書との違い
    ・3の実⾏パートに関する書籍は多いが、その前後も含めて重要
    1.準備
    2.⼊⼝
    3.実⾏
    4.出⼝
    ü 多くの技術書はここを詳細に解説
    ü AI開発・データ分析を実務・本業
    にできない、という悩みに対するヒ
    ント
    ü 収益への貢献やビジネスメリットは
    超⼤切
    ü 結果を出さない分析チームはコス
    トセンターになり縮⼩へ
    ü 業界の基礎知識

    View Slide

  19. Copyright © 2020 NOB DATA All Rights Reserved.
    プロジェクトの⼊⼝(案件獲得)から出⼝(収益化)までの流れの俯瞰
    個⼈的におすすめの読み⽅は、まず本の裏表紙を⾒て章単位で全体感の把握。(⼊⼝ -> 出⼝の流れ)
    次に⽬次を眺めて気になった節をピックアップして読み込む(⽬次だけでも⼤体わかる形になっています)
    裏表紙で全体の流れを把握 ⽬次で節と⼩⾒出しを確認
    1.準備
    2.⼊⼝
    3.実⾏
    4.出⼝

    View Slide

  20. Copyright © 2020 NOB DATA All Rights Reserved.
    プロジェクトの⼊⼝(案件獲得)から出⼝(収益化)までの流れの俯瞰
    ⽬次で節と⼩⾒出しを確認 気になる節を精読
    気になる節をみつけたら詳細を確認。
    本書ではソースコードなどは基本的に出てこないため、⾮プログラマーの⽅でも読める内容となっています。

    View Slide

  21. Copyright © 2020 NOB DATA All Rights Reserved.
    対象読者別のおすすめの章
    ジュニアデータサイエンティストを中⼼として、AIやデータサイエンスのビジネス活⽤・プロジェクト推進に興
    味をお持ちの皆様(学⽣、ジュニア・ミドル・シニアDS、経営層、講師の⽴場の⽅など)
    ü ジュニア・データサイエンティスト前後
    の⽅を中⼼に想定した構成
    ü シニア・データサイエンティストは本書
    の内容は⼀通り把握されている想定
    (後進の育成や取引先への解説など
    にご活⽤ください)
    ü 分析チームの設⽴を考えている経営
    層や、AI教育を⾏う教員の皆様に
    もおすすめの⼀冊です

    View Slide

  22. Copyright © 2020 NOB DATA All Rights Reserved.
    注意
    • ⼀般的に、通常のITサービス開発よりAI開発の⽅が難易度(不確実性)が⾼いです
    • 最初は通常のITシステム開発の流れを⾝につけてから、AIの開発を検討することをお勧めします

    View Slide

  23. アジェンダ
    Copyright © 2020 NOB DATA All Rights Reserved.
    メインセッション 19:15 – 20:15
    • オープニング & ⾃⼰紹介(⼤城、皆さん) 15min
    • 本編 45min
    1. 本⽇お伝えしたいこと & 本の紹介 10min
    2. AIに対する認識の確認 & 事例 10min
    3. 業界背景とスキルセット 10min
    4. 実際のAI・データ分析プロジェクトのイメージ 10min
    5. まとめと皆さんのネクストアクション 5min
    質問セッション 20:15 – 20:30 (or 20:45)
    • 質疑応答 15〜30min

    View Slide

  24. Copyright © 2020 NOB DATA All Rights Reserved.
    AIに対する基礎認識チェック
    ・皆さんはAIと聞いて何を思い浮かべますか︖
    ・ドラえもん︖
    ・アルファ碁︖
    ・⾃動運転︖
    ・AIエアコン︖
    ・チャットボット・・︖
    ・与信モデル︖
    ・レコメンドエンジン︖

    View Slide

  25. Copyright © 2020 NOB DATA All Rights Reserved.
    AIに対する基礎認識チェック
    ・皆さんはAIと聞いて何を思い浮かべますか︖
    ・ドラえもん︖
    ・アルファ碁︖
    ・⾃動運転︖
    ・AIエアコン︖
    ・チャットボット・・︖
    ・与信モデル︖
    ・レコメンドエンジン︖
    ・上記はいずれも広義のAIですが、
    単に売りやすく名前をつけているだけの可能性もあるので
    AIサービスを作る側は違いを理解する必要があります(最低限以下くらいには)
    ・ドラえもん︖ => まだ空想の世界だけ。たまに勘違いしている⼈がいるがまだまだ実現していない
    ・アルファ碁︖ => ディープラーニング、強化学習等による学習済みモデル
    ・⾃動運転︖ => 画像処理やルールベースによる判断などを組み込んだ⼀分野
    ・AIエアコン︖ => ITシステムのエアコンを単に名前を変えただけ(だと思う)
    ・チャットボット・・︖ => 多くはルールベースのITシステム。(AIと⾔いたいだけ)
    ・与信モデル︖ => 狭義のAI(⼈⼯知能)という意味では⼀番近い
    ・レコメンドエンジン︖ => これも狭義のAIの⼀つの応⽤形

    View Slide

  26. Copyright © 2020 NOB DATA All Rights Reserved.
    AI・データ分析を⽤いたプロダクト例
    ・Web上より6個 + 書籍よりいくつかご説明

    View Slide

  27. 例① : ⼝コミ分析(感情分析)
    Webからのデータ収

    (APIやスクレイピング)
    テキスト解析・可視化
    次の施策の
    検討材料とする
    https://www.itmedia.co.jp/news/articles/1411/12/news089.html
    活⽤事例

    View Slide

  28. ②選挙の当選予測 (2016参院選, 91%正解)
    過去の当選結果と
    候補者指名の検索
    クエリのデータ収集
    相関関係の可視化
    やモデル化
    独⾃の選挙予測を
    出す(&答え合わ
    せ)
    https://about.yahoo.co.jp/info/bigdata/election/2016/02/
    活⽤事例

    View Slide

  29. ③在宅予測 (不要配送を92%削減)
    スマートメーターの
    IoTデバイス情報取

    曜⽇・時間帯の在
    宅確率を算出・可
    視化
    宅配の配送計画の
    最適化
    https://www.fnn.jp/posts/00405230HDK
    活⽤事例

    View Slide

  30. ④業界の事例 : ソフトバンクの接続率No.1
    https://cloud.watch.impress.co.jp/docs/interview/611351.html
    活⽤事例

    View Slide

  31. ⑤業界の事例 : 廃棄ロス75%減のスシロー
    http://www2.cgu.ac.jp/kyouin/takaha
    shi/siryou/jouhou_syokugyou/sushiro.
    pdf
    活⽤事例

    View Slide

  32. ⑥業界の事例 : AIカメラのトライアル
    https://www.nikkei.com/article/DGXMZO36179460
    V01C18A0962M00/
    活⽤事例

    View Slide

  33. Copyright © 2020 NOB DATA All Rights Reserved.
    その他にも、各業界での活⽤例
    ・広告や⾦融業界などは1%予測精度が上がるだけで数⼗億円以上利益が出るケースも多い
    ・ECでもレコメンドエンジンの改善による売り上げUPなど、マッチング系のビジネスとも相性が良い
    ・⼀⽅で医療業界では法規制があるなど、業界によってビジネス適⽤の状況が全く異なる
    (事例は11章全般)

    View Slide

  34. Copyright © 2020 NOB DATA All Rights Reserved.
    結局は何を解決したいかが⼤事
    ・(細かいことは置いておいて) 実務で使えれば個⼈的にはどれもOK
    ・ビジネスにおいてAI(やプログラミング)は⼿段であって、⽬的では無い
    ・ちなみに新規サービスの開発だけがAI開発・データ分析ではない(既存ビジネスのグロースハック等)
    ・なお、AIの予測・分類モデルは通常は精度は100%にはならない
    (100%だと基本的に過学習を起こしている状態なので、使えない)
    ・AI化するかどうか、どこまで精度をチューニングするかは基本的には費⽤対効果次第
    (=ビジネスインパクト次第)(外注すると結構⾼いので)

    View Slide

  35. Copyright © 2020 NOB DATA All Rights Reserved.
    ちなみに︓求⼈の7-8割は東京圏に集中
    ・本格的にやりたいなら東京も視野にいれるべき(競合も多いが)

    View Slide

  36. アジェンダ
    Copyright © 2020 NOB DATA All Rights Reserved.
    メインセッション 19:15 – 20:15
    • オープニング & ⾃⼰紹介(⼤城、皆さん) 15min
    • 本編 45min
    1. 本⽇お伝えしたいこと & 本の紹介 10min
    2. AIに対する認識の確認 & 事例 10min
    3. 業界背景とスキルセット 10min
    4. 実際のAI・データ分析プロジェクトのイメージ 10min
    5. まとめと皆さんのネクストアクション 5min
    質問セッション 19:15 – 20:15
    • 質疑応答 15min

    View Slide

  37. Copyright © 2020 NOB DATA All Rights Reserved.
    ①データ分析環境の変化(1/2)
    ・データの種類と量の爆発的な増加と活⽤(7-1節)
    -> ビッグデータ解析の前提となる環境が整ってきた(データは21世紀の⽯油、とも⾔われる)
    kB -> MB -> GB -> TB -> PB -> EB -> ZB

    View Slide

  38. Copyright © 2020 NOB DATA All Rights Reserved.
    ①データ分析環境の変化(2/2)
    ・もう⼀つの流れとして、圧倒的な研究開発費を背景とするGAFA系各種クラウド(1-2節) (10-4節)の
    普及や分析⾔語・ライブラリの充実(7-3節)による、環境構築費⽤の⼤幅な低下
    -> 数千万の投資が必要だったビッグデータ解析もクラウドを使えば数百円から始められるように

    View Slide

  39. Copyright © 2020 NOB DATA All Rights Reserved.
    ②データサイエンティストの誕⽣(1/2)
    ・その結果、データサイエンティストの誕⽣(1-1節)と、スキルセット定義(2-1節)や⼈材育成の動き
    ・Tokyo.R(2010年〜)やPyData.Tokyo(2014年〜)など技術コミュニティも誕⽣

    View Slide

  40. Copyright © 2020 NOB DATA All Rights Reserved.
    ②データサイエンティストの誕⽣(2/2)
    ・データサイエンティストが誕⽣して10年弱、専⾨化も進んできている(2-2節)が、依然経験重視、
    かつコンサルとしてのビジネススキルも求められるため⽣存戦略(2-3節)を考える必要性はある

    View Slide

  41. Copyright © 2020 NOB DATA All Rights Reserved.
    時間あれば補⾜︓実⾏フェーズを少し深堀
    ・分析⼿法やプログラミング⾔語周りはここに該当
    1.準備
    2.⼊⼝
    3.実⾏
    4.出⼝
    ü 多くの技術書はここを詳細に解説
    ü AI開発・データ分析を実務・本業
    にできない、という悩みに対するヒ
    ント
    ü 収益への貢献やビジネスメリットは
    超⼤切
    ü 結果を出さない分析チームはコス
    トセンターになり縮⼩へ
    ü 業界の基礎知識

    View Slide

  42. Copyright © 2020 NOB DATA All Rights Reserved.
    a. みんなのPython勉強会 参加者向けより
    ・Pythonに興味のあるエンジニアの⽅や、場合によっては学⽣さんもいらっしゃるかと思います
    ・AI・データ分析プロジェクトに興味のある⽅は以下の節をお勧めします(その2)
    ・7-1 業界によるデータの種類とビジネスでの活⽤⽅法 -> 業界ごとの特徴を押さえましょう
    ・7-2 データの実情と前処理の⼤切さ -> Python⼤活躍
    ・7-3 ツール・プログラミング⾔語の選択 -> Pythonも、それ以外も環境・⼈員に合わせて利⽤
    ・7-4 ⽬的によるデータ分析⼿法の違い -> 様々な解析⼿法の基礎
    ・8-1 効果測定の重要性 -> AI開発・分析PJを進める上で必須
    ・8-4 A/BテストやA/Aテスト -> A/Aはちょっと聞き慣れないかも︖

    View Slide

  43. Copyright © 2020 NOB DATA All Rights Reserved.
    a. みんなのPython勉強会 参加者向けより
    ・Pythonに興味のあるエンジニアの⽅や、場合によっては学⽣さんもいらっしゃるかと思います
    ・AI・データ分析プロジェクトに興味のある⽅は以下の節をお勧めします(その3)
    ・9-1 分析結果のレポート化 -> 必須
    ・9-2 データ分析から導くアクション -> アクション(意思決定)につながらない分析は価値を出しにくい
    ・9-4 中間テーブルを⽤いた効率化 -> SQL必須
    ・10-1 データ基盤を作る前に考えること -> ショットの場合は作らなくて良い
    ・10-4 クラウドの選定 -> 基盤を作るとなったら検討
    ・10-7 AI実運⽤のためのスキルセット -> DevOpsを拡張してMLOpsエンジニア
    ・11章のプロジェクトバリュー、12章の業界事例全般

    View Slide

  44. アジェンダ
    Copyright © 2020 NOB DATA All Rights Reserved.
    メインセッション 19:15 – 20:15
    • オープニング & ⾃⼰紹介(⼤城、皆さん) 15min
    • 本編 45min
    1. 本⽇お伝えしたいこと & 本の紹介 10min
    2. AIに対する認識の確認 & 事例 10min
    3. 業界背景とスキルセット 10min
    4. 実際のAI・データ分析プロジェクトのイメージ 10min
    5. まとめと皆さんのネクストアクション 5min
    質問セッション 20:15 – 20:30 (or 20:45)
    • 質疑応答 15〜30min

    View Slide

  45. Copyright © 2020 NOB DATA All Rights Reserved.
    通常のIT開発とAI開発の違い
    ・通常のIT開発は要件(ゴール)が決まればそこを⽬指せばOK
    (新規プロダクト開発はまた別)
    ・⼀⽅でAI・データ分析のプロジェクトは「精度」をどこまで上げるか、
    という問題になるので終わりが読めない
    => なので判断基準としてのビジネスインパクトの⾒積もりが重要

    View Slide

  46. Copyright © 2020 NOB DATA All Rights Reserved.
    プロジェクトの⽬的とビジネスメリット
    ・問題設定が⼤切。何を解決したいのか
    ・それはAIでないとダメなのか︖(もっと簡単に解決する⼿段はないのか︖)
    ・⾃社で提案する場合だけでなく、クライアントにサービスを売る場合も、投資家に対して話をする場合
    は基本的にこの辺の話は必要(投資対効果。⾃分のお⾦の場合を除く)

    View Slide

  47. Copyright © 2020 NOB DATA All Rights Reserved.
    データの種類の豊富さと前処理⼯程
    ・扱うデータによって全然形式・アプローチが異なる
    ・ディプラーニングでなんでもできると思うのは⼤きな勘違い
    (ここでデータハンドリングのためのプログラミングスキルや、データ分析、統計学、機械学習の知識が必
    要になることが多い)
    ・関連スキルとしてはデータ収集のクローリングの技術や、DBやAWS等クラウド環境での分析基盤構
    築スキル(ハードルを下げるとExcelやBIツールなどの操作技術)

    View Slide

  48. Copyright © 2020 NOB DATA All Rights Reserved.
    プログラミング⾔語の選定や分析⼿法の検討
    ・具体的にどのような⾔語で、どのような分析⼿法を使うかを検討
    ・今はPythonで⼀通りできる(昔はRで分析、実装はPythonやC++のケースも)
    ・この辺はチーム体制や⽬的に合わせて選ぶ形
    (プログラミング⾔語は⽤途によって向き不向きがあるので、⽤途に応じて複数⾔語を利⽤)

    View Slide

  49. Copyright © 2020 NOB DATA All Rights Reserved.
    モデルの評価とチューニング
    ・どこまで精度を上げるか、の前にちゃんと作ったAIモデルの予測精度を評価
    (この辺は結構統計とか数学とかやっていると有利)
    ・その後差分の検証やデータの追加(特徴量エンジニアリング)、モデルの改良などで少しずつ精度を上げる
    ・どこまで精度を上げるべきかは要検討
    この辺はPCR検査で
    偽陰性、偽陽性とか
    いわれてるものと同じ

    View Slide

  50. Copyright © 2020 NOB DATA All Rights Reserved.
    AIモデルのサービスイン
    ・今回は詳細は割愛
    ・作ったモデルの安定運⽤も⾼度なスキルが必要
    (MLOpsと⾔われている領域)
    ・AI化の前にまずはシンプルなルールベース等でのAPI開発を経験してから
    モデルのサービス利⽤を検討した⽅が順序としては良い
    チームでできる場合。
    ⼀⼈の場合は結構⼤変

    View Slide

  51. アジェンダ
    Copyright © 2020 NOB DATA All Rights Reserved.
    メインセッション 19:15 – 20:15
    • オープニング & ⾃⼰紹介(⼤城、皆さん) 15min
    • 本編 45min
    1. 本⽇お伝えしたいこと & 本の紹介 10min
    2. AIに対する認識の確認 & 事例 10min
    3. 業界背景とスキルセット 10min
    4. 実際のAI・データ分析プロジェクトのイメージ 10min
    5. まとめと皆さんのネクストアクション 5min
    質問セッション 20:15 – 20:30 (or 20:45)
    • 質疑応答 15〜30min

    View Slide

  52. Copyright © 2020 NOB DATA All Rights Reserved.
    まとめのようなもの
    まとめと振り返り
    ・AI開発の実際の部分をざっと解説しました
    ・正直、IT開発以上にAI開発は⾼難易度。 (程度にもよるが) 未経験で臨むのはかなりリスキー
    ・実務経験が⼤事。そのための⼊り⼝にどう⽴つか︖
    キャリア例
    a. 就職からの積み上げ型のDS・AIエンジニアのキャリアの例
    0. 独学 or スクールでプログラミングスキルの基礎を覚える
    1. エンジニアとして就職・転職 -> 3年でIT開発のイロハを⼀通りマスター
    2. 並⾏して分析系勉強会に参加 & LT発表、AI技術の基礎を⾝につける
    2. 並⾏して、本業のビジネス課題を発掘、改善案を検討
    3. 本業の側、20%-30%稼働でAI開発の経験を積む。最初は業務改善 (2年くらい)
    4. AI開発・データ分析が⼀通りできるようになったら稼働を上げて新規サービスにチャレンジ
    5. PJを⼀通り回せるようになったら副業->フリーランス->起業
    b. もう少しビジネスよりのスキルセット を⾝につける場合
    1. 例えばプランナーがSQLをマスターして、事業企画に利⽤するなど
    (データプランナー、ビジネストランスレーターなど)
    2. インフラエンジニアから初めて、ログの解析・異常検知などでスキルアップを⽬指す、など
    c. その他
    1. 要検討。少なくとも未経験OKで年収1000万︕とかは釣りなので注意
    2. 資⾦が潤沢にあるのであれば経験者を雇うと⾔う⼿もある(普通に外注すると⾼いが・・)

    View Slide

  53. アジェンダ
    Copyright © 2020 NOB DATA All Rights Reserved.
    メインセッション 19:15 – 20:15
    • オープニング & ⾃⼰紹介(⼤城、皆さん) 15min
    • 本編 45min
    1. 本⽇お伝えしたいこと & 本の紹介 10min
    2. AIに対する認識の確認 & 事例 10min
    3. 業界背景とスキルセット 10min
    4. 実際のAI・データ分析プロジェクトのイメージ 10min
    5. まとめと皆さんのネクストアクション 5min
    質問セッション 20:15 – 20:30 (or 20:45)
    • 質疑応答 15〜30min

    View Slide

  54. Copyright © 2020 NOB DATA All Rights Reserved.
    ご案内︓読者フォローアップ会の企画中
    ・⽉1くらいでこの本の読者向けのフォローアップ会を予定しています
    ・初回は1/26(⽕) 19:00-21:00の予定 (ページ作成はこれから)
    ・NOB DATAのTech Playの以下のグループフォローしてもらえればページ出来次第ご案内が⾶ぶと
    思いますので、お気軽にどうぞ
    https://techplay.jp/community/nobdata

    View Slide

  55. Copyright © 2020 NOB DATA All Rights Reserved.
    ご清聴、ありがとうございました・・︕︕
    (何かありましたら[email protected] (⼤城)
    までお気軽にご連絡ください)

    View Slide

  56. Copyright © 2020 NOB DATA All Rights Reserved.
    以下、参考資料

    View Slide

  57. Copyright © 2020 NOB DATA All Rights Reserved.
    おすすめの章 ①学⽣・未経験者
    学⽣・データ分析プロジェクト未経験者には第1部準備編全部と、第3部実⾏の⼀部、第4部出
    ⼝の12章「業界事例」
    をお勧めします
    ü 2021年時点のデータサイエン
    ティストが置かれている状況を
    把握
    ü 必要なスキルセットを把握
    ü 今後データ分析⼈材を⽬指す
    かの参考にする
    ü どの業界のデータ分析者を⽬指
    すかを考える参考情報
    (あくまで⼀例)








    ü データの前処理、各種分析⼿
    法、RやPythonなどの⾔語、
    クラウド技術などが実務のどの
    タイミングでどのような⽬的で⽤
    いられるかの全体感を把握する

    View Slide

  58. Copyright © 2020 NOB DATA All Rights Reserved.
    おすすめの章 ②ジュニア・ミドルDS
    ジュニアDSには第3部の実⾏編を中⼼に、ミドルDSにはマネージメント観点を⼊れてその前後の部
    (第2部⼊⼝編〜第4部出⼝編)をお勧めします。
    ü 案件化に向けた動き
    ü データ管理や契約周りの⾜回り
    の整備(主にミドルDS向け)
    ü 業界別の出⼝戦略の検討








    ü 何をするにもまずは先⾏事例の
    調査
    ü プロジェクト管理
    (特に、ミドルDSの⽅)
    ü プロジェクト実⾏全般
    (特に、ジュニアDSの⽅)

    View Slide

  59. Copyright © 2020 NOB DATA All Rights Reserved.
    おすすめの章 ③経営層・分析チームマネージャー
    これから⾃社にAIやDX、データ分析チームを⽴ち上げようと考えられている⽅はざっと全体的にご⼀読
    いただく事をおすすめします。(特にチームビルディング関連)
    ü 分析チームの第1号案件をな
    ににするか
    ü データの管理⽅法
    ü 業界別の出⼝戦略の検討
    ü 投資対効果の検討








    ü どのようなテーマに取り組むべき

    ü どのような⼈材を集めるべきか
    ü (ご⾃⾝で実⾏はしない前提
    で) 実際に分析チームが今後
    想定されるタスクについて検討

    View Slide

  60. Copyright © 2020 NOB DATA All Rights Reserved.
    おすすめの章 ④教員
    これからAI⼈材を育成される教員の皆さんには全体的に俯瞰していただき、学術的に必要なスキル
    セット以外の、実ビジネスで必要なビジネススキルについて参考にしていただければと思います。
    (これらは授業というより、学⽣⾃⾝が勉強会やインターンなどで経験を積む必要があります)
    ü (ここは後回しでもOK)
    ü 特にどの業界に強い学⽣を育成
    するかの⼀つの参考として








    ü 直近10年のAI⼈材ニーズの
    変化から、今後を占う
    ü 変化の激しい分野であることの
    確認
    ü 授業で教えている各種分析⼿
    法やITスキルがどのように実務
    に利⽤されているかの把握

    View Slide

  61. Copyright © 2020 NOB DATA All Rights Reserved.
    NOB DATA株式会社 特徴② PJチーム育成
    ü 分析プロジェクトチーム側に⽴ったアドバイスで円滑なプロジェクト推進を⽀援
    ü NOB DATAと同じような分析を継続してできるようにするための⼈材育成・ノウハウ共有

    View Slide

  62. Copyright © 2020 NOB DATA All Rights Reserved.
    NOB DATAが⽬指す未来の⼀つ
    1. まず、各社でAI・データ分析プロジェクトが円滑に回る状態の構築
    • ⼈材不⾜問題 -> 副業⼈材、協会活動(九州⽀部、DS47)
    • ビジネスノウハウ不⾜ -> 本書やアドバイザリーサービス
    2. AI・データ分析による各社の業績UP & 実務経験を積んだ⾼度IT⼈材の輩出
    3. 育った⼈材が今度はアドバイザーとして分析コミュニティに参画 & 各種業界全体の底上げ &
    新規ビジネス創出
    ü AI・分析⼈材のリソースが各企業・業種を循環するエコシステムの構築を⽬指す
    ü データ活⽤でより良いサービス、より良い働き⽅、より良いビジネス

    View Slide

  63. Copyright © 2020 NOB DATA All Rights Reserved.
    やりがい的な部分
    ⾯⽩い部分
    ・企業内の様々な⽴場の⼈と接点を作るチャンスがある(営業的要素)
    ・各種テクノロジーの⼒を借りれるので可能性が広がる(技術的要素)
    ・他の⼈がなかなか知らないことに気がつけるチャンスがある(研究的要素)
    ・理数系に⾒えて、最終的に⼈⽂系、というか⼈に終着する点(普遍的な要素)
    その他
    ・エンジニア35歳定年説の別の可能性
    ・スペシャリスト指向、ではなくゼネラリスト指向の⼈材の活躍の場の⼀つ
    不満(不向き)な部分
    ・⼀⽅でデータ分析は0->1は基本的に苦⼿だなと(データがないと判断できない)

    View Slide

  64. Copyright © 2020 NOB DATA All Rights Reserved.
    第1部 準備編 概要
    ・業界の概要、DSのスキルセットやキャリアパス、始め⽅、情報収集に関する内容がまとめられています

    View Slide

  65. Copyright © 2020 NOB DATA All Rights Reserved.
    第2部 ⼊⼝編 概要
    ・プロジェクトの案件化の話からデータの取り扱いや他社との契約形体についてのプロジェクトがスタート
    するまでの段階の話が書かれています

    View Slide

  66. Copyright © 2020 NOB DATA All Rights Reserved.
    第3部 実⾏編 概要
    ・プロジェクトが始まった後のプロジェクトマネジメントやデータ分析、レポーティングといったプロジェクトの
    実⾏フェーズの話がまとめられています。

    View Slide

  67. Copyright © 2020 NOB DATA All Rights Reserved.
    第4部 出⼝編 概要
    ・プロジェクトの出⼝戦略は最も重要な要素の⼀つと⾔っても過⾔ではありません。業界別の特徴を抑
    えてどのように分析コストに⾒合う成果を出すか、といったヒントがまとめられています。

    View Slide

  68. Copyright © 2020 NOB DATA All Rights Reserved.
    メモ︓今回は書いてないけどどこかで話したい内容
    1. 再現性の重要性と困難さ、そのための抽象化⼒
    2. バリバリの「データサイエンティスト」以外の関わり⽅、⽊⽥さんの⾔う「ビジネストランスレーター」
    3. 現在のデータサイエンスは学問のための⼿法であって売り上げを上げる⼿法ではない
    (by サイバーエージェント 安井さん)
    4. データサイエンティスト職の誕⽣以前と以後のエンジニアのキャリアパスの変化、そもそもなぜ⾼単価
    なのか(スペシャリスト、ゼネラリスト、さらに経営層へのリーチ)
    5. AIはイチ⼿段として捉えた際に、結局最終的にやりたいことはなんでしたっけ︖
    6. データ分析は理数系だとおもったら最後は⼈⽂系のスキル、というか⼈に⾏き着いた件について
    7. ノウハウはデータサイエンティスト⼀⼈⼀⼈の頭の中に、ただ外からは評価されにくい
    (会社としての評価)
    8. DSを⽬指す場合、他業種からのピボットが⼀番確実ではないか︖

    View Slide

  69. Copyright © 2020 NOB DATA All Rights Reserved.
    ご参考︓TJOさんの書評
    ・全般的に良いコメントと、参考書籍もっと欲しいというコメント頂いております
    ・詳細なレビュー、ありがとうございます・・︕︕(参考書籍はどこかで整備したいですね。)
    https://tjo.hatenablog.com
    /entry/2020/12/22/180000

    View Slide