AI案件のよくある落とし穴と人材育成株式会社キカガク
View Slide
2018 Kikagaku, Inc. All Rights Reserved 2会社概要*機械学習とディープラーニングを含む協力会社会社名 株式会社キカガク設立日 2017年1月代表 吉崎 亮介所在地 東京都豊島区池袋PLANACTIONDOCHECKWe provide education in the best style for you人工知能(AI)*における教育とコンサルティングサービスを提供
2018 Kikagaku, Inc. All Rights Reserved 3吉 崎 亮 介株式会社キカガク代表取締役社長代表者紹介人と人とが教え合える優しい世界をつくる✓日経ビッグデータ -「機械学習のデータはそもそも企業内にない、地道に整える企業が優位に立てる」 (2017.10.20)✓共同通信社 -AIどう使う? 教育で社会への橋渡しを 26歳社長「好きなことで生きる」(2018.1.23)掲載された記事の紹介1991年生まれ京都出身舞鶴高等専門学校画像処理とロボット制御の研究に従事ITベンチャー企業へ就職京都大学大学院機械学習による製造業のプロセス改善に従事株式会社キカガク設立東京大学客員研究員へ就任コンサルティング現場で得た知見を教育へ教育コンサルティング
2018 Kikagaku, Inc. All Rights Reserved実績 (法人設立から1年)4日本マイクロソフトとPreferred Networksの初の公認のデータサイエンス人材養成企業経済産業省認定大手AI企業公認 共同プロジェクト多数ディープラーニングハンズオンセミナーが「第四次産業革命スキル習得講座認定制度」に採択データサイエンス人材を育成するプロジェクトに参画01000200030002017.3 2017.6 2017.9 2017.12#Students受講生3000人 54321満足度1 0 0 %
2018 Kikagaku, Inc. All Rights ReservedAIとは?5引用:人工知能、機械学習、ディープラーニングの違いとは(Nvidia)
2018 Kikagaku, Inc. All Rights ReservedAI・機械学習・ディープラーニングの違い6
2018 Kikagaku, Inc. All Rights Reserved学習と推論7モデル入力変数 x 出力変数 t(教師データ)名前:佐藤さん学習名前:鈴木さん・・・・・・
2018 Kikagaku, Inc. All Rights Reserved学習と推論8入力変数 x 出力変数 y(予測値)推論学習済みモデル名前:鈴木さん
2018 Kikagaku, Inc. All Rights Reserved教師データ作成の例題9MRI画像から異常な箇所とその病名を予測する機械学習のモデルを構築したい。依頼する前にどのようなデータを準備しておくべきか考えてください。
2018 Kikagaku, Inc. All Rights Reserved教師データ作成の例題10MRI画像から異常な箇所とその病名を予測する機械学習のモデルを構築したい。依頼する前にどのようなデータを準備しておくべきか考えてください。(x1,y1) = (200, 250)(x2,y2) = (250, 300)ラベル:腫瘍箇所と病名を予測したい場合は同じ形式の教師データが必要
2018 Kikagaku, Inc. All Rights Reserved 11Step1. 画像の分類(CNN)Step2. 物体の検出(R-CNN)今西吉崎顔ロゴその他、GANと呼ばれる技術で画像の生成もできるが、後述する検証の問題で導入までの障害が高いため、今回は省略ディープラーニングが成果を出している領域
2018 Kikagaku, Inc. All Rights Reserved 12Step1. 文書の分類(NN)Step2. 機械翻訳(RNN)野球 サッカーラグビーバッターイチロースマホ急速充電電動ホットコールド自動車お風呂私 / は / 吉崎 / です /。 / よろしく / お願い / します / 。 /→ 私 / は / キカガク / です /。 / こちらこそ / よろしく / お願い / します / 。 /ディープラーニングが成果を出している領域
AIエンジニアになることは難しいのか?学ぶ → 使う・導入するには、大きなハードルがある当社調べWebアンケート回答人数 200名
開発フロー
開発フロー1.企画・ヒアリングポイントAIがすべてでないことを認識した上で、使うべき案件かを確認
開発フロー2.環境構築ポイント• 最初は解析環境を整備するのも一大プロジェクト• ディープラーニングでは事実上GPUが不可欠であるため、リモートのサーバー上で環境構築できる人材が必要• AzureのData Science VM上にNvidia-dockerなどでライブラリをまとめた環境を移植して構築すれば15分程度で環境構築が可能
開発フロー3.教師データ作成ポイント• 枚数が多い場合は時間をかけてでも、前処理アプリを作成• 画像・動画系のラベル付けはMicrosoftが公開しているVOTTが便利• 教師データ作成向けのアウトソーシングサービスも増加
開発フロー4.前処理・構造化ポイント• 前処理は「自然言語 前処理」のように調べると大体わかる• 前処理の時間はプログラミングスキルに大きく依存(初心者は結構厳しい)• 構造化は「自然言語 特徴量」のように調べると大体わかるが、どれを使うべきか選択が難しい(有識者に聞くのが早い)私は吉崎です。 x = [ ???, ???, …, ??? ]固定長のベクトル株式会社キカガク(株)キカガクキカガク株式会社キカガク前処理構造化
開発フロー5.モデル構築(機械学習)ポイント• 万能な方法はないため、各アルゴリズムを適材適所で使う• 前処理や特徴量選択によっても性能が変わるため、アルゴリズム単体で考えるだけでは不十分• 各アルゴリズムのハイパーパラメータを抑えておく機械学習の代表的なアルゴリズム• ディープラーニング• Support Vector Machine(SVM)• 決定木• ガウス過程• K-means• 主成分分析
開発フロー6.仮運用・検証ポイント• 精度100%が出ないことを踏まえて人手でカバーできる運用フローが不可欠
開発フロー7.システム統合ポイント• Webアプリケーションの場合、WebAPIで予測値のやり取りを行うことが多い• 組み込みではエッジで処理するかクラウドで処理するか• 精度が出るが深すぎるNNは、推論で思わぬネックとなる• DockerやKubernetesのような仮想化技術は機械学習エンジニアには不可欠
一緒に勉強しましょう! #キカガク #dllab本日の感想をお願いしますディープラーニングハンズオンセミナー『dllab.ai』で検索!環境構築↓前処理・構造化↓モデル構築画像・時系列・自然言語福岡@Microsoft福岡・6/2(土), 6/9(土), 6/16(土)・7/4(水)-7/6(金)Webページ:http://dllab.ai/academy/deep-learning-hands-on-seminar/申し込み・問い合わせ先[email protected]
ご清聴ありがとうございました。