5 はじめに l お話すること l 皆さんが就職した後や、就活の⾯接で喋るのに使えるようなAI・機械学習の説明 l ⽇本企業におけるAI導⼊の状況 l 「AI活⽤の課題」におけるの注⽬キーワード l お話しないこと l 数学的な機械学習の仕組みについてのお話 l 皆様に理解してもらうための「機械学習とは?」というお話 l 個別のドメインにおけるコアな最新技術のお話
19 このように、現状はAI活⽤は⼆極化していますが、 個⼈的には「AIを使ってみた」はなんだかんだ増えると思っています。(ただし「活⽤」はまだ別) 理由は、いわゆる「AIの⺠主化」の勢いがすごいためです。 「AIの⺠主化」に関連して、ここで触れたいキーワードは、以下の4つです 「AIの⺠主化」 ü Auto ML ü 学習済みモデルのAPI化 ü 学習済みモデルの公開 ü GoogleのAutoML Zero
20 Auto ML l インプットされたデータに対して最適な前処理、アルゴリズム、ハイパーパラメータを探索し、簡単に⾼精度 なモデルを作成する技術 l ⼀般的なタスクであれば、データ作成までできれば投⼊するだけでコンペ上位レベルのモデルができる l 各社、いろいろなサービスを出しており、ISIDもOpTApfというサービスをリリース OpTApfの製品ページ→https://isid-ai.jp/products/optapf.html https://youtu.be/0nGdTPJvjDI 具体的なサービスイメージ サービスによって異なるが、 例えばMicrosoftのAuto MatedMLは、協調フィルタリ ングとベイズ最適化問題を組み 合わせることで、上記の探索を 効率化している 以下のAzure Machine Learningの動画がわかりやすいです しくみ https://arxiv.org/pdf/1705.05355.pdf
22 学習済みモデルの公開 l API化はまだされていなくても、様々な学習済みモデルがインターネット上で公開されている l 公開された学習済みモデルは、少しのコードを書くだけで利⽤することができる l ただし商⽤利⽤が制限されていることも多いので、ライセンスには注意 Hugging Face Model Hub: https://huggingface.co/models Pytorch Hub: https://pytorch.org/hub/ onnxのGit Hub https://github.com/onnx/models
23 AutoML-Zero l Googleが開発したアルゴリズム l 進化的アルゴリズムによって、ゼロから今まで⼈類が発⾒してきた⼿法をAIが⾃分で発⾒する l ReLUや、誤差逆伝播法などを⽤いた⼆層ニューラルネットワークを⾃⼒で発⾒ l まだ安定的に⾼精度なアルゴリズムを作成はできず、実⽤段階ではないとのこと https://ai.googleblog.com/2020/07/automl-zero-evolving-code-that-learns.html AutoML-Zeroの進化の過 程
28 MLOps = AI活⽤に必要な要素ぜんぶ つまり、AIの実運⽤・活⽤するにあたっては、 AI⾃体はほんの⼀部で、AI以外の仕組みが⼤部分を占めることになります そこで、ここでは「MLOps」という観点から以下のキーワードについてご紹介します ü 連合学習(Federated Learning) ü メタ学習 ü モデルの軽量化 ü AIに対するセキュリティ
32 連合学習(Federation Learning) 背景の課題 l データを収集する際、プライバシーの問題や機密性がハードルになることが多い l スマホやアプリなどでユーザーの情報を収集したとしても、それをクラウド上に集約できない l 各企業がもっているデータを外に出さずに、企業間で協⼒したい 概要 l データを⼀箇所に集約して学習するのではなく、データを保持したデバイスごとに分散してモデルを訓練 l 各デバイスは、訓練によって得られたパラメータの勾配だけをクラウドに送信し、 ⼤元のモデルのパラメータを更新する https://arxiv.org/pdf/1907.09693.pdf
37 モデルの軽量化 背景の課題 l ⾼精度なモデルではパラメータ数が増え、リッチな計算資源が必要になる傾向がある l しかし、エッジデバイスなどで訓練や推論を⾏うユースケースでは、リッチな計算資源確保ができない (エッジじゃなかったとしても、リソースを確保するのはたいへん) 概要 l ネットワーク中の重要度が低いノードを削減してパラメータ数を減らしたり、⾏列計算を簡易化して演算回 数をへらすなどの⼯夫によって、精度をできるだけ確保しつつ必要なメモリや演算回数を削減する 元々のネットワーク 重要度が低いネットワークを削除