Slide 1

Slide 1 text

AIエンジニアを育成するための プロセスと落とし穴 株式会社キカガク

Slide 2

Slide 2 text

2018 Kikagaku, Inc. All Rights Reserved 2 会社概要 *機械学習とディープラーニングを含む 協力会社 会社名 株式会社キカガク 設立日 2017年1月 代表 吉崎 亮介 所在地 東京都豊島区池袋 PLAN ACTION DO CHECK We provide education in the best style for you 人工知能(AI)*における教育と コンサルティングサービスを提供

Slide 3

Slide 3 text

2018 Kikagaku, Inc. All Rights Reserved 3 吉 崎 亮 介 株式会社キカガク 代表取締役社長 代表者紹介 人と人とが教え合える 優しい世界をつくる ✓日経ビッグデータ -「機械学習のデータはそ もそも企業内にない、地道に整える企業が 優位に立てる」 (2017.10.20) ✓共同通信社 -AIどう使う? 教育で 社会への橋渡しを 26歳社長「好き なことで生きる」(2018.1.23) 掲載された 記事の紹介 1991年生まれ 京都出身 舞鶴高等専門学校 画像処理とロボット制御の 研究に従事 ITベンチャー 企業へ就職 京都大学大学院 機械学習による 製造業のプロセ ス改善に従事 株式会社 キカガク 設立 東京大学 客員研究員 へ就任 コンサルティング現場で 得た知見を教育へ 教育 コンサル ティング

Slide 4

Slide 4 text

2018 Kikagaku, Inc. All Rights Reserved 実績 (法人設立から1年) 4 日本マイクロソフトと Preferred Networksの 初の公認のデータサイ エンス人材養成企業 経済産業省認定 大手AI企業公認 共同プロジェクト多数 ディープラーニングハン ズオンセミナーが「第四 次産業革命スキル習得講 座認定制度」に採択 データサイエンス人材を 育成するプロジェクトに 参画 0 1000 2000 3000 2017.3 2017.6 2017.9 2017.12 #Students 受講生 3000人 5 4 3 2 1 満足度 1 0 0 %

Slide 5

Slide 5 text

2018 Kikagaku, Inc. All Rights Reserved AIとは? 5 引用:人工知能、機械学習、ディープラーニングの違いとは(Nvidia)

Slide 6

Slide 6 text

2018 Kikagaku, Inc. All Rights Reserved AI・機械学習・ディープラーニングの違い 6

Slide 7

Slide 7 text

2018 Kikagaku, Inc. All Rights Reserved 学習と推論 7 モデル 入力変数 x 出力変数 t (教師データ) 名前:佐藤さん 学習 名前:鈴木さん ・ ・ ・ ・ ・ ・

Slide 8

Slide 8 text

2018 Kikagaku, Inc. All Rights Reserved 学習と推論 8 入力変数 x 出力変数 y (予測値) 推論 学習済み モデル 名前:鈴木さん

Slide 9

Slide 9 text

2018 Kikagaku, Inc. All Rights Reserved 教師データ作成の例題 9 MRI画像から異常な箇所とその病名を予測する機械学習 のモデルを構築したい。依頼する前にどのようなデータを 準備しておくべきか考えてください。

Slide 10

Slide 10 text

2018 Kikagaku, Inc. All Rights Reserved 教師データ作成の例題 10 MRI画像から異常な箇所とその病名を予測する機械学習 のモデルを構築したい。依頼する前にどのようなデータを 準備しておくべきか考えてください。 (x1 ,y1 ) = (200, 250) (x2 ,y2 ) = (250, 300) ラベル:腫瘍 箇所と病名を予測したい場合は同じ形式の教師データが必要

Slide 11

Slide 11 text

2018 Kikagaku, Inc. All Rights Reserved 11 Step1. 画像の分類(CNN) Step2. 物体の検出(R-CNN) 今 西 吉 崎 顔 ロゴ その他、GANと呼ばれる技術で 画像の生成もできるが、後述す る検証の問題で導入までの障害 が高いため、今回は省略 ディープラーニングが成果を出している領域

Slide 12

Slide 12 text

2018 Kikagaku, Inc. All Rights Reserved 12 Step1. 文書の分類(NN) Step2. 機械翻訳(RNN) 野球 サッカー ラグビー バッター イチロー スマホ 急速充電 電動 ホット コールド 自動車 お風呂 私 / は / 吉崎 / です /。 / よろしく / お願い / します / 。 / → 私 / は / キカガク / です /。 / こちらこそ / よろしく / お願い / します / 。 / ディープラーニングが成果を出している領域

Slide 13

Slide 13 text

AIエンジニアになることは難しいのか? 学ぶ → 使う・導入するには、大きなハードルがある 当社調べ Webアンケート 回答人数 200名

Slide 14

Slide 14 text

開発フロー

Slide 15

Slide 15 text

開発フロー 1.企画・ヒアリング ポイント AIがすべてでないことを認識した上で、使うべき案件かを確認

Slide 16

Slide 16 text

開発フロー 2.環境構築 ポイント • 最初は解析環境を整備するのも一大プロジェクト • ディープラーニングでは事実上GPUが不可欠であるため、リモート のサーバー上で環境構築できる人材が必要 • AzureのData Science VM上にNvidia-dockerなどでライブラリをまとめた 環境を移植して構築すれば15分程度で環境構築が可能

Slide 17

Slide 17 text

開発フロー 3.教師データ作成 ポイント • 枚数が多い場合は時間をかけてでも、前処理アプリを作成 • 画像・動画系のラベル付けはMicrosoftが公開しているVOTTが便利 • 教師データ作成向けのアウトソーシングサービスも増加

Slide 18

Slide 18 text

開発フロー 4.前処理・構造化 ポイント • 前処理は「自然言語 前処理」のように調べると大体わかる • 前処理の時間はプログラミングスキルに大きく依存(初心者は結構厳しい) • 構造化は「自然言語 特徴量」のように調べると大体わかるが、どれを 使うべきか選択が難しい(有識者に聞くのが早い) 私は吉崎です。 x = [ ???, ???, …, ??? ] 固定長のベクトル 株式会社キカガク (株)キカガク キカガク株式会社 キカガク 前処理 構造化

Slide 19

Slide 19 text

開発フロー 5.モデル構築(機械学習) ポイント • 万能な方法はないため、各アルゴリズムを適材適所で使う • 前処理や特徴量選択によっても性能が変わるため、アルゴリズム単体で 考えるだけでは不十分 • 各アルゴリズムのハイパーパラメータを抑えておく 機械学習の代表的なアルゴリズム • ディープラーニング • Support Vector Machine(SVM) • 決定木 • ガウス過程 • K-means • 主成分分析

Slide 20

Slide 20 text

開発フロー 6.仮運用・検証 ポイント • 精度100%が出ないことを踏まえて人手でカバーできる運用フローが不可欠

Slide 21

Slide 21 text

開発フロー 7.システム統合 ポイント • Webアプリケーションの場合、 WebAPIで予測値のやり取 りを行うことが多い • 組み込みではエッジで処理する かクラウドで処理するか • 精度が出るが深すぎるNNは、 推論で思わぬネックとなる • DockerやKubernetesのような仮想 化技術は機械学習エンジニアに は不可欠

Slide 22

Slide 22 text

2018 Kikagaku, Inc. All Rights Reserved よくある質問 22 今後どういったことを 学べば良いですか?

Slide 23

Slide 23 text

2018 Kikagaku, Inc. All Rights Reserved キャリアパス 23 • ビジネスとの橋渡し人材 • データサイエンティスト • 機械学習エンジニア

Slide 24

Slide 24 text

2018 Kikagaku, Inc. All Rights Reserved ビジネスとの橋渡し人材 24 簡単な解析+可視化が大切 身の回りの事象に対して適用可能である問題を探して、 データを整理して適用してみる力 企画〜粗い解析・レポート・仕様書までが対象となりま す。BIツールやAzure MLのようなツールを使いこなし、 素早く解析できる力をつけると良いと思います。

Slide 25

Slide 25 text

2018 Kikagaku, Inc. All Rights Reserved データサイエンティスト 25 多くの機械学習のアルゴリズムを詳細に知る データが与えられた際に、こういうモデル化もできると 提案できるかは知っている引き出しの数に大きく依存し ます。また、画像や自然言語処理といったデータのハン ドリングや、DBにアクセスしてデータ整理などの機械学 習の前工程〜学習(予測精度の検証結果が算出できる) までのスキルが必要です。 機械学習プロフェッショナルシリーズやTop Gearシリー ズなどの参考書で勉強すると良いと思います。Scikit- learnやchainer、opencvやmecab、jupyter, ipython-sql などを学ぶと良いと思います。

Slide 26

Slide 26 text

2018 Kikagaku, Inc. All Rights Reserved 機械学習エンジニア 26 学習済みモデルをプロダクトで運用可能となるようにイ ンフラを作り、モデルをデプロイし、定期的にモデルの 再学習を行うような仕組みを作ります。また、サービス が大きくなると多くのアクセスを捌く必要があり、ス ケールに対応するリソースの最適化も必要となります。 データサイエンティストと被るところもありますが、学 習〜デプロイ・運用までです。DockerやKubernetes、 Azureなどのクラウドの使い方、FlaskなどのWebフレーム ワークなどを学ぶと良いと思います。

Slide 27

Slide 27 text

2018 Kikagaku, Inc. All Rights Reserved

Slide 28

Slide 28 text

2018 Kikagaku, Inc. All Rights Reserved

Slide 29

Slide 29 text

2018 Kikagaku, Inc. All Rights Reserved

Slide 30

Slide 30 text

2018 Kikagaku, Inc. All Rights Reserved AIで実績をあげるためには人材の確保が必要 30 採用を選択しても、育成できるエコシステムがなければ 長期的に成功できない 採用 優秀な人材を採用は難しく、 コストも高い 採用できたとしても、育成で きる環境がないとすぐに辞め てしまう 育成 スキルセットが豊富に必要な ため育成には時間がかかる ノウハウが個別に貯まるため、 チームとして育成ができない 人材獲得には「採用」と「育成」の2パターンがある

Slide 31

Slide 31 text

2018 Kikagaku, Inc. All Rights Reserved 研修事業者を選ぶ際のポイント 31 ヒアリング データ収集 / 整理 非構造データ → 構造データ モデル構築 (機械学習) 仮運用 検証 システム 統合 資料作成 よくあるセミナーは ここしか学ばない 前工程 後工程 本当にAI開発の導入を 視野に入れた場合 モデル構築だけでなく、 前工程と後工程も視野に 入れた研修が必要 → 少なくとも半年は要する AI人材を育成したいのですが、どのように勉強すれば 良いでしょうか?期間や習得できる内容も教えてほしいです。 よくある質問

Slide 32

Slide 32 text

2018 Kikagaku, Inc. All Rights Reserved AI人材育成のよくある失敗談1 32 知識を習得後、実践の機会が あるも、研修の内容と実務で の解析のレベルに大きな乖離 があり、手も足も出ない ✓多くの研修ではモデル構築に フォーカスを当てるも現場の解析 はデータ整理や環境構築、うまく いかない時の対処など教科書通り に解析を行えることはまずない ✓一般的なセミナーでは、各個別の 案件に対応した内容ではないため、 実プロジェクトへの適用方法は 自ら考えないといけない 研修で知識を習得するも、実務に必要なレベルに達せず、 結局使うことができない レベルに大きな乖離 実務 知識の インプット

Slide 33

Slide 33 text

2018 Kikagaku, Inc. All Rights Reserved 33 解決策 AI人材として実案件の開発に取りかかれるまでの 確実な研修フローを提供 講師兼メンター 育成したい社内の人材 知識のインプット ケーススタディ メンターと企画立案 実務 運 用 ↑ デ プ ロ イ ↑ モ デ ル 構 築 ↑ デ ー タ 収 集 ・ 整 理 ↑ 環 境 構 築 ↑ プ ラ ン ニ ン グ

Slide 34

Slide 34 text

2018 Kikagaku, Inc. All Rights Reserved AI人材育成のよくある失敗談2 34 研修で知識として理解するも、 業務で実践機会が見つからず、 モチベーションがフェードアウト クラウドソーシングやRPA*の 延長線上にAI案件は存在し、 AIで即解決できる問題は少ない AIによる 自動化の検討 費用対効果 高 低 高 低 データの整理状況 (入出力の量と質) RPAによる 自動化を検討 現状維持 クラウドソーシ ング等を検討 知識習得後に案件がなく、モチベーションがフェードアウト *RPA: Robotic Process Automation

Slide 35

Slide 35 text

2018 Kikagaku, Inc. All Rights Reserved 35 解決策 PART 1 メンタリング PART 2 PART 3 難しい質問は フォロー メリット ✓ 実案件がない場合も メンタリングにより モチベーションを維 持でき、理解が大き く深まる ✓ 人材育成のスピード を加速することがで きる ✓ 育成のコストを大幅 に抑えられる AI人材育成のためのエコシステム形成(受講者→メンター) 講師兼メンター 育成したい社内の人材 育成したい社内の人材 メンター

Slide 36

Slide 36 text

2018 Kikagaku, Inc. All Rights Reserved

Slide 37

Slide 37 text

2018 Kikagaku, Inc. All Rights Reserved

Slide 38

Slide 38 text

2018 Kikagaku, Inc. All Rights Reserved

Slide 39

Slide 39 text

ご清聴ありがとうございました。