Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20180720_AIエンジニア育成のプロセスと落とし穴.pdf

Ryosuke Yoshizaki
July 20, 2018
430

 20180720_AIエンジニア育成のプロセスと落とし穴.pdf

Ryosuke Yoshizaki

July 20, 2018
Tweet

More Decks by Ryosuke Yoshizaki

Transcript

  1. AIエンジニアを育成するための
    プロセスと落とし穴
    株式会社キカガク

    View full-size slide

  2. 2018 Kikagaku, Inc. All Rights Reserved 2
    会社概要
    *機械学習とディープラーニングを含む
    協力会社
    会社名 株式会社キカガク
    設立日 2017年1月
    代表 吉崎 亮介
    所在地 東京都豊島区池袋
    PLAN
    ACTION
    DO
    CHECK
    We provide education in the best style for you
    人工知能(AI)*における教育と
    コンサルティングサービスを提供

    View full-size slide

  3. 2018 Kikagaku, Inc. All Rights Reserved 3
    吉 崎 亮 介
    株式会社キカガク
    代表取締役社長
    代表者紹介
    人と人とが教え合える
    優しい世界をつくる
    ✓日経ビッグデータ -「機械学習のデータはそ
    もそも企業内にない、地道に整える企業が
    優位に立てる」 (2017.10.20)
    ✓共同通信社 -AIどう使う? 教育で
    社会への橋渡しを 26歳社長「好き
    なことで生きる」(2018.1.23)
    掲載された
    記事の紹介
    1991年生まれ
    京都出身
    舞鶴高等専門学校
    画像処理とロボット制御の
    研究に従事
    ITベンチャー
    企業へ就職
    京都大学大学院
    機械学習による
    製造業のプロセ
    ス改善に従事
    株式会社
    キカガク
    設立
    東京大学
    客員研究員
    へ就任
    コンサルティング現場で
    得た知見を教育へ
    教育
    コンサル
    ティング

    View full-size slide

  4. 2018 Kikagaku, Inc. All Rights Reserved
    実績 (法人設立から1年)
    4
    日本マイクロソフトと
    Preferred Networksの
    初の公認のデータサイ
    エンス人材養成企業
    経済産業省認定
    大手AI企業公認 共同プロジェクト多数
    ディープラーニングハン
    ズオンセミナーが「第四
    次産業革命スキル習得講
    座認定制度」に採択
    データサイエンス人材を
    育成するプロジェクトに
    参画
    0
    1000
    2000
    3000
    2017.3 2017.6 2017.9 2017.12
    #Students
    受講生
    3000人 5
    4
    3
    2
    1
    満足度
    1 0 0 %

    View full-size slide

  5. 2018 Kikagaku, Inc. All Rights Reserved
    AIとは?
    5
    引用:人工知能、機械学習、ディープラーニングの違いとは(Nvidia)

    View full-size slide

  6. 2018 Kikagaku, Inc. All Rights Reserved
    AI・機械学習・ディープラーニングの違い
    6

    View full-size slide

  7. 2018 Kikagaku, Inc. All Rights Reserved
    学習と推論
    7
    モデル
    入力変数 x 出力変数 t
    (教師データ)
    名前:佐藤さん
    学習
    名前:鈴木さん






    View full-size slide

  8. 2018 Kikagaku, Inc. All Rights Reserved
    学習と推論
    8
    入力変数 x 出力変数 y
    (予測値)
    推論
    学習済み
    モデル
    名前:鈴木さん

    View full-size slide

  9. 2018 Kikagaku, Inc. All Rights Reserved
    教師データ作成の例題
    9
    MRI画像から異常な箇所とその病名を予測する機械学習
    のモデルを構築したい。依頼する前にどのようなデータを
    準備しておくべきか考えてください。

    View full-size slide

  10. 2018 Kikagaku, Inc. All Rights Reserved
    教師データ作成の例題
    10
    MRI画像から異常な箇所とその病名を予測する機械学習
    のモデルを構築したい。依頼する前にどのようなデータを
    準備しておくべきか考えてください。
    (x1
    ,y1
    ) = (200, 250)
    (x2
    ,y2
    ) = (250, 300)
    ラベル:腫瘍
    箇所と病名を予測したい場合は同じ形式の教師データが必要

    View full-size slide

  11. 2018 Kikagaku, Inc. All Rights Reserved 11
    Step1. 画像の分類(CNN)
    Step2. 物体の検出(R-CNN)

    西



    ロゴ
    その他、GANと呼ばれる技術で
    画像の生成もできるが、後述す
    る検証の問題で導入までの障害
    が高いため、今回は省略
    ディープラーニングが成果を出している領域

    View full-size slide

  12. 2018 Kikagaku, Inc. All Rights Reserved 12
    Step1. 文書の分類(NN)
    Step2. 機械翻訳(RNN)
    野球 サッカー
    ラグビー
    バッター
    イチロー
    スマホ
    急速充電
    電動
    ホット
    コールド
    自動車
    お風呂
    私 / は / 吉崎 / です /。 / よろしく / お願い / します / 。 /
    → 私 / は / キカガク / です /。 / こちらこそ / よろしく / お願い / します / 。 /
    ディープラーニングが成果を出している領域

    View full-size slide

  13. AIエンジニアになることは難しいのか?
    学ぶ → 使う・導入するには、大きなハードルがある
    当社調べ
    Webアンケート
    回答人数 200名

    View full-size slide

  14. 開発フロー

    View full-size slide

  15. 開発フロー
    1.企画・ヒアリング
    ポイント
    AIがすべてでないことを認識した上で、使うべき案件かを確認

    View full-size slide

  16. 開発フロー
    2.環境構築
    ポイント
    • 最初は解析環境を整備するのも一大プロジェクト
    • ディープラーニングでは事実上GPUが不可欠であるため、リモート
    のサーバー上で環境構築できる人材が必要
    • AzureのData Science VM上にNvidia-dockerなどでライブラリをまとめた
    環境を移植して構築すれば15分程度で環境構築が可能

    View full-size slide

  17. 開発フロー
    3.教師データ作成
    ポイント
    • 枚数が多い場合は時間をかけてでも、前処理アプリを作成
    • 画像・動画系のラベル付けはMicrosoftが公開しているVOTTが便利
    • 教師データ作成向けのアウトソーシングサービスも増加

    View full-size slide

  18. 開発フロー
    4.前処理・構造化
    ポイント
    • 前処理は「自然言語 前処理」のように調べると大体わかる
    • 前処理の時間はプログラミングスキルに大きく依存(初心者は結構厳しい)
    • 構造化は「自然言語 特徴量」のように調べると大体わかるが、どれを
    使うべきか選択が難しい(有識者に聞くのが早い)
    私は吉崎です。 x = [ ???, ???, …, ??? ]
    固定長のベクトル
    株式会社キカガク
    (株)キカガク
    キカガク株式会社
    キカガク
    前処理
    構造化

    View full-size slide

  19. 開発フロー
    5.モデル構築(機械学習)
    ポイント
    • 万能な方法はないため、各アルゴリズムを適材適所で使う
    • 前処理や特徴量選択によっても性能が変わるため、アルゴリズム単体で
    考えるだけでは不十分
    • 各アルゴリズムのハイパーパラメータを抑えておく
    機械学習の代表的なアルゴリズム
    • ディープラーニング
    • Support Vector Machine(SVM)
    • 決定木
    • ガウス過程
    • K-means
    • 主成分分析

    View full-size slide

  20. 開発フロー
    6.仮運用・検証
    ポイント
    • 精度100%が出ないことを踏まえて人手でカバーできる運用フローが不可欠

    View full-size slide

  21. 開発フロー
    7.システム統合
    ポイント
    • Webアプリケーションの場合、
    WebAPIで予測値のやり取
    りを行うことが多い
    • 組み込みではエッジで処理する
    かクラウドで処理するか
    • 精度が出るが深すぎるNNは、
    推論で思わぬネックとなる
    • DockerやKubernetesのような仮想
    化技術は機械学習エンジニアに
    は不可欠

    View full-size slide

  22. 2018 Kikagaku, Inc. All Rights Reserved
    よくある質問
    22
    今後どういったことを
    学べば良いですか?

    View full-size slide

  23. 2018 Kikagaku, Inc. All Rights Reserved
    キャリアパス
    23
    • ビジネスとの橋渡し人材
    • データサイエンティスト
    • 機械学習エンジニア

    View full-size slide

  24. 2018 Kikagaku, Inc. All Rights Reserved
    ビジネスとの橋渡し人材
    24
    簡単な解析+可視化が大切
    身の回りの事象に対して適用可能である問題を探して、
    データを整理して適用してみる力
    企画〜粗い解析・レポート・仕様書までが対象となりま
    す。BIツールやAzure MLのようなツールを使いこなし、
    素早く解析できる力をつけると良いと思います。

    View full-size slide

  25. 2018 Kikagaku, Inc. All Rights Reserved
    データサイエンティスト
    25
    多くの機械学習のアルゴリズムを詳細に知る
    データが与えられた際に、こういうモデル化もできると
    提案できるかは知っている引き出しの数に大きく依存し
    ます。また、画像や自然言語処理といったデータのハン
    ドリングや、DBにアクセスしてデータ整理などの機械学
    習の前工程〜学習(予測精度の検証結果が算出できる)
    までのスキルが必要です。
    機械学習プロフェッショナルシリーズやTop Gearシリー
    ズなどの参考書で勉強すると良いと思います。Scikit-
    learnやchainer、opencvやmecab、jupyter, ipython-sql
    などを学ぶと良いと思います。

    View full-size slide

  26. 2018 Kikagaku, Inc. All Rights Reserved
    機械学習エンジニア
    26
    学習済みモデルをプロダクトで運用可能となるようにイ
    ンフラを作り、モデルをデプロイし、定期的にモデルの
    再学習を行うような仕組みを作ります。また、サービス
    が大きくなると多くのアクセスを捌く必要があり、ス
    ケールに対応するリソースの最適化も必要となります。
    データサイエンティストと被るところもありますが、学
    習〜デプロイ・運用までです。DockerやKubernetes、
    Azureなどのクラウドの使い方、FlaskなどのWebフレーム
    ワークなどを学ぶと良いと思います。

    View full-size slide

  27. 2018 Kikagaku, Inc. All Rights Reserved

    View full-size slide

  28. 2018 Kikagaku, Inc. All Rights Reserved

    View full-size slide

  29. 2018 Kikagaku, Inc. All Rights Reserved

    View full-size slide

  30. 2018 Kikagaku, Inc. All Rights Reserved
    AIで実績をあげるためには人材の確保が必要
    30
    採用を選択しても、育成できるエコシステムがなければ
    長期的に成功できない
    採用
    優秀な人材を採用は難しく、
    コストも高い
    採用できたとしても、育成で
    きる環境がないとすぐに辞め
    てしまう
    育成
    スキルセットが豊富に必要な
    ため育成には時間がかかる
    ノウハウが個別に貯まるため、
    チームとして育成ができない
    人材獲得には「採用」と「育成」の2パターンがある

    View full-size slide

  31. 2018 Kikagaku, Inc. All Rights Reserved
    研修事業者を選ぶ際のポイント
    31
    ヒアリング
    データ収集
    / 整理
    非構造データ →
    構造データ
    モデル構築
    (機械学習)
    仮運用
    検証
    システム
    統合
    資料作成
    よくあるセミナーは
    ここしか学ばない
    前工程 後工程
    本当にAI開発の導入を
    視野に入れた場合
    モデル構築だけでなく、 前工程と後工程も視野に
    入れた研修が必要 → 少なくとも半年は要する
    AI人材を育成したいのですが、どのように勉強すれば
    良いでしょうか?期間や習得できる内容も教えてほしいです。
    よくある質問

    View full-size slide

  32. 2018 Kikagaku, Inc. All Rights Reserved
    AI人材育成のよくある失敗談1
    32
    知識を習得後、実践の機会が
    あるも、研修の内容と実務で
    の解析のレベルに大きな乖離
    があり、手も足も出ない
    ✓多くの研修ではモデル構築に
    フォーカスを当てるも現場の解析
    はデータ整理や環境構築、うまく
    いかない時の対処など教科書通り
    に解析を行えることはまずない
    ✓一般的なセミナーでは、各個別の
    案件に対応した内容ではないため、
    実プロジェクトへの適用方法は
    自ら考えないといけない
    研修で知識を習得するも、実務に必要なレベルに達せず、
    結局使うことができない
    レベルに大きな乖離
    実務
    知識の
    インプット

    View full-size slide

  33. 2018 Kikagaku, Inc. All Rights Reserved 33
    解決策
    AI人材として実案件の開発に取りかかれるまでの
    確実な研修フローを提供
    講師兼メンター
    育成したい社内の人材
    知識のインプット ケーススタディ メンターと企画立案 実務


































    View full-size slide

  34. 2018 Kikagaku, Inc. All Rights Reserved
    AI人材育成のよくある失敗談2
    34
    研修で知識として理解するも、
    業務で実践機会が見つからず、
    モチベーションがフェードアウト
    クラウドソーシングやRPA*の
    延長線上にAI案件は存在し、
    AIで即解決できる問題は少ない
    AIによる
    自動化の検討
    費用対効果




    データの整理状況
    (入出力の量と質)
    RPAによる
    自動化を検討
    現状維持
    クラウドソーシ
    ング等を検討
    知識習得後に案件がなく、モチベーションがフェードアウト
    *RPA: Robotic Process Automation

    View full-size slide

  35. 2018 Kikagaku, Inc. All Rights Reserved 35
    解決策
    PART 1
    メンタリング
    PART 2
    PART 3
    難しい質問は
    フォロー
    メリット
    ✓ 実案件がない場合も
    メンタリングにより
    モチベーションを維
    持でき、理解が大き
    く深まる
    ✓ 人材育成のスピード
    を加速することがで
    きる
    ✓ 育成のコストを大幅
    に抑えられる
    AI人材育成のためのエコシステム形成(受講者→メンター)
    講師兼メンター 育成したい社内の人材
    育成したい社内の人材
    メンター

    View full-size slide

  36. 2018 Kikagaku, Inc. All Rights Reserved

    View full-size slide

  37. 2018 Kikagaku, Inc. All Rights Reserved

    View full-size slide

  38. 2018 Kikagaku, Inc. All Rights Reserved

    View full-size slide

  39. ご清聴ありがとうございました。

    View full-size slide