Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20180720_AIエンジニア育成のプロセスと落とし穴.pdf

Ryosuke Yoshizaki
July 20, 2018
450

 20180720_AIエンジニア育成のプロセスと落とし穴.pdf

Ryosuke Yoshizaki

July 20, 2018
Tweet

More Decks by Ryosuke Yoshizaki

Transcript

  1. 2018 Kikagaku, Inc. All Rights Reserved 2 会社概要 *機械学習とディープラーニングを含む 協力会社

    会社名 株式会社キカガク 設立日 2017年1月 代表 吉崎 亮介 所在地 東京都豊島区池袋 PLAN ACTION DO CHECK We provide education in the best style for you 人工知能(AI)*における教育と コンサルティングサービスを提供
  2. 2018 Kikagaku, Inc. All Rights Reserved 3 吉 崎 亮

    介 株式会社キカガク 代表取締役社長 代表者紹介 人と人とが教え合える 優しい世界をつくる ✓日経ビッグデータ -「機械学習のデータはそ もそも企業内にない、地道に整える企業が 優位に立てる」 (2017.10.20) ✓共同通信社 -AIどう使う? 教育で 社会への橋渡しを 26歳社長「好き なことで生きる」(2018.1.23) 掲載された 記事の紹介 1991年生まれ 京都出身 舞鶴高等専門学校 画像処理とロボット制御の 研究に従事 ITベンチャー 企業へ就職 京都大学大学院 機械学習による 製造業のプロセ ス改善に従事 株式会社 キカガク 設立 東京大学 客員研究員 へ就任 コンサルティング現場で 得た知見を教育へ 教育 コンサル ティング
  3. 2018 Kikagaku, Inc. All Rights Reserved 実績 (法人設立から1年) 4 日本マイクロソフトと

    Preferred Networksの 初の公認のデータサイ エンス人材養成企業 経済産業省認定 大手AI企業公認 共同プロジェクト多数 ディープラーニングハン ズオンセミナーが「第四 次産業革命スキル習得講 座認定制度」に採択 データサイエンス人材を 育成するプロジェクトに 参画 0 1000 2000 3000 2017.3 2017.6 2017.9 2017.12 #Students 受講生 3000人 5 4 3 2 1 満足度 1 0 0 %
  4. 2018 Kikagaku, Inc. All Rights Reserved 学習と推論 7 モデル 入力変数

    x 出力変数 t (教師データ) 名前:佐藤さん 学習 名前:鈴木さん ・ ・ ・ ・ ・ ・
  5. 2018 Kikagaku, Inc. All Rights Reserved 学習と推論 8 入力変数 x

    出力変数 y (予測値) 推論 学習済み モデル 名前:鈴木さん
  6. 2018 Kikagaku, Inc. All Rights Reserved 教師データ作成の例題 10 MRI画像から異常な箇所とその病名を予測する機械学習 のモデルを構築したい。依頼する前にどのようなデータを

    準備しておくべきか考えてください。 (x1 ,y1 ) = (200, 250) (x2 ,y2 ) = (250, 300) ラベル:腫瘍 箇所と病名を予測したい場合は同じ形式の教師データが必要
  7. 2018 Kikagaku, Inc. All Rights Reserved 11 Step1. 画像の分類(CNN) Step2.

    物体の検出(R-CNN) 今 西 吉 崎 顔 ロゴ その他、GANと呼ばれる技術で 画像の生成もできるが、後述す る検証の問題で導入までの障害 が高いため、今回は省略 ディープラーニングが成果を出している領域
  8. 2018 Kikagaku, Inc. All Rights Reserved 12 Step1. 文書の分類(NN) Step2.

    機械翻訳(RNN) 野球 サッカー ラグビー バッター イチロー スマホ 急速充電 電動 ホット コールド 自動車 お風呂 私 / は / 吉崎 / です /。 / よろしく / お願い / します / 。 / → 私 / は / キカガク / です /。 / こちらこそ / よろしく / お願い / します / 。 / ディープラーニングが成果を出している領域
  9. 開発フロー 4.前処理・構造化 ポイント • 前処理は「自然言語 前処理」のように調べると大体わかる • 前処理の時間はプログラミングスキルに大きく依存(初心者は結構厳しい) • 構造化は「自然言語

    特徴量」のように調べると大体わかるが、どれを 使うべきか選択が難しい(有識者に聞くのが早い) 私は吉崎です。 x = [ ???, ???, …, ??? ] 固定長のベクトル 株式会社キカガク (株)キカガク キカガク株式会社 キカガク 前処理 構造化
  10. 開発フロー 7.システム統合 ポイント • Webアプリケーションの場合、 WebAPIで予測値のやり取 りを行うことが多い • 組み込みではエッジで処理する かクラウドで処理するか

    • 精度が出るが深すぎるNNは、 推論で思わぬネックとなる • DockerやKubernetesのような仮想 化技術は機械学習エンジニアに は不可欠
  11. 2018 Kikagaku, Inc. All Rights Reserved キャリアパス 23 • ビジネスとの橋渡し人材

    • データサイエンティスト • 機械学習エンジニア
  12. 2018 Kikagaku, Inc. All Rights Reserved ビジネスとの橋渡し人材 24 簡単な解析+可視化が大切 身の回りの事象に対して適用可能である問題を探して、

    データを整理して適用してみる力 企画〜粗い解析・レポート・仕様書までが対象となりま す。BIツールやAzure MLのようなツールを使いこなし、 素早く解析できる力をつけると良いと思います。
  13. 2018 Kikagaku, Inc. All Rights Reserved データサイエンティスト 25 多くの機械学習のアルゴリズムを詳細に知る データが与えられた際に、こういうモデル化もできると

    提案できるかは知っている引き出しの数に大きく依存し ます。また、画像や自然言語処理といったデータのハン ドリングや、DBにアクセスしてデータ整理などの機械学 習の前工程〜学習(予測精度の検証結果が算出できる) までのスキルが必要です。 機械学習プロフェッショナルシリーズやTop Gearシリー ズなどの参考書で勉強すると良いと思います。Scikit- learnやchainer、opencvやmecab、jupyter, ipython-sql などを学ぶと良いと思います。
  14. 2018 Kikagaku, Inc. All Rights Reserved 機械学習エンジニア 26 学習済みモデルをプロダクトで運用可能となるようにイ ンフラを作り、モデルをデプロイし、定期的にモデルの

    再学習を行うような仕組みを作ります。また、サービス が大きくなると多くのアクセスを捌く必要があり、ス ケールに対応するリソースの最適化も必要となります。 データサイエンティストと被るところもありますが、学 習〜デプロイ・運用までです。DockerやKubernetes、 Azureなどのクラウドの使い方、FlaskなどのWebフレーム ワークなどを学ぶと良いと思います。
  15. 2018 Kikagaku, Inc. All Rights Reserved AIで実績をあげるためには人材の確保が必要 30 採用を選択しても、育成できるエコシステムがなければ 長期的に成功できない

    採用 優秀な人材を採用は難しく、 コストも高い 採用できたとしても、育成で きる環境がないとすぐに辞め てしまう 育成 スキルセットが豊富に必要な ため育成には時間がかかる ノウハウが個別に貯まるため、 チームとして育成ができない 人材獲得には「採用」と「育成」の2パターンがある
  16. 2018 Kikagaku, Inc. All Rights Reserved 研修事業者を選ぶ際のポイント 31 ヒアリング データ収集

    / 整理 非構造データ → 構造データ モデル構築 (機械学習) 仮運用 検証 システム 統合 資料作成 よくあるセミナーは ここしか学ばない 前工程 後工程 本当にAI開発の導入を 視野に入れた場合 モデル構築だけでなく、 前工程と後工程も視野に 入れた研修が必要 → 少なくとも半年は要する AI人材を育成したいのですが、どのように勉強すれば 良いでしょうか?期間や習得できる内容も教えてほしいです。 よくある質問
  17. 2018 Kikagaku, Inc. All Rights Reserved AI人材育成のよくある失敗談1 32 知識を習得後、実践の機会が あるも、研修の内容と実務で

    の解析のレベルに大きな乖離 があり、手も足も出ない ✓多くの研修ではモデル構築に フォーカスを当てるも現場の解析 はデータ整理や環境構築、うまく いかない時の対処など教科書通り に解析を行えることはまずない ✓一般的なセミナーでは、各個別の 案件に対応した内容ではないため、 実プロジェクトへの適用方法は 自ら考えないといけない 研修で知識を習得するも、実務に必要なレベルに達せず、 結局使うことができない レベルに大きな乖離 実務 知識の インプット
  18. 2018 Kikagaku, Inc. All Rights Reserved 33 解決策 AI人材として実案件の開発に取りかかれるまでの 確実な研修フローを提供

    講師兼メンター 育成したい社内の人材 知識のインプット ケーススタディ メンターと企画立案 実務 運 用 ↑ デ プ ロ イ ↑ モ デ ル 構 築 ↑ デ ー タ 収 集 ・ 整 理 ↑ 環 境 構 築 ↑ プ ラ ン ニ ン グ
  19. 2018 Kikagaku, Inc. All Rights Reserved AI人材育成のよくある失敗談2 34 研修で知識として理解するも、 業務で実践機会が見つからず、

    モチベーションがフェードアウト クラウドソーシングやRPA*の 延長線上にAI案件は存在し、 AIで即解決できる問題は少ない AIによる 自動化の検討 費用対効果 高 低 高 低 データの整理状況 (入出力の量と質) RPAによる 自動化を検討 現状維持 クラウドソーシ ング等を検討 知識習得後に案件がなく、モチベーションがフェードアウト *RPA: Robotic Process Automation
  20. 2018 Kikagaku, Inc. All Rights Reserved 35 解決策 PART 1

    メンタリング PART 2 PART 3 難しい質問は フォロー メリット ✓ 実案件がない場合も メンタリングにより モチベーションを維 持でき、理解が大き く深まる ✓ 人材育成のスピード を加速することがで きる ✓ 育成のコストを大幅 に抑えられる AI人材育成のためのエコシステム形成(受講者→メンター) 講師兼メンター 育成したい社内の人材 育成したい社内の人材 メンター