Save 37% off PRO during our Black Friday Sale! »

機械学習における様々な学習方法について違いを理解する

Fd6de6cbad68e7898078f548b6dd894c?s=47 K
September 20, 2021

 機械学習における様々な学習方法について違いを理解する

以下にリストアップした様々な○○学習という言葉について、それがどういうものを指しているのかを概説します。動画での説明:https://youtu.be/8gBIgYTFFLs

・教師あり学習(supervised learning)
・教師なし学習(unsupervised learning)
・半教師あり学習(semi-supervised learning)
・弱教師あり学習(weak-supervised learning)
・自己教師あり学習(self-supervised learning)
・トランスダクティブ学習 (transductive inference)
・オンライン学習(sequential learning)
・強化学習(reinforcement learning)
・能動学習(active learning)

Fd6de6cbad68e7898078f548b6dd894c?s=128

K

September 20, 2021
Tweet

Transcript

  1. ,ͷษڧνϟϯωϧ

  2. 今回の内容 •『問題設定』とは? •学習時のデータの使い方に基づいた問題設定の分類 機械学習でモデルを作成する様々な方法について紹介します

  3. 『問題設定』とは アルゴリズムの入力と出力を定義して、解決する課題を示したもの アルゴリズム・関数 入力 出力 データ 画像・映像 教師ラベル 数値 分類

    画像の領域 :FTɾ/P   ʜ 入力・出力をどのように使用するかに依って アルゴリズムの種類を分類分けすることができる
  4. 『問題設定』を学習方法の視点から分類 学習(訓練データとラベルを使ってパラメータを調整)する方法によって呼び名が異なる •教師あり学習(supervised learning) •教師なし学習(unsupervised learning) •半教師あり学習(semi-supervised learning) •弱教師あり学習(weak-supervised learning)

    •自己教師あり学習(self-supervised learning) •トランスダクティブ学習 (transductive inference) •オンライン学習(sequential learning) •強化学習(reinforcement learning) •能動学習(active learning)
  5. 教師あり学習(supervised learning) すべてのデータに対してラベルが付いた学習データを用いて予測モデルを訓練 予測モデル 訓練データ 出力 犬 猫 犬 猫

    入力 訓練データの画像ひとつひとつに、 それが何の画像であるかの正解ラベルが付いている データを入力として受け取ると正しいラベルを 出力できるようにパラメータを調整する 猫の画像
  6. 教師なし学習(unsupervised learning) ラベルが付いていないデータを用いて予測モデルを作成 予測モデル データ 出力 入力 と は同じグループ データにラベルは付いていないが、

    データをもとに何らかの予測・構造化を行う データをまとめたりデータを分解した りして、意味のある構造を見つけ出す 猫の画像
  7. 半教師あり学習(semi-supervised learning) 教師ラベルがあるデータと無いデータを両方使って予測モデルを訓練 予測モデル データ 出力 入力 猫の画像 犬 猫

    ? 猫 データは大量にあるが、 データにラベルをつけるのが非常に高コスト データにどのようなものがあるか・どのような分布 でデータが存在しているかを知り、予測に役立てる Chapelle, Olivier, Bernhard Scholkopf, and Alexander Zien. "Semi-supervised learning (chapelle, o. et al., eds.; 2006)[book reviews]." IEEE Transactions on Neural Networks 20.3 (2009): 542-542.
  8. 弱教師あり学習(weak-supervised learning) 完全に正解とは限らないラベルを用いて予測モデルを学習 予測モデル データとweak-label 出力 入力 猫の画像 犬 猫

    猫 クラウドソーシングで集めたデータなど、 ラベルが不正確であり、完全なラベルが得られない クラウドワーカーの作成したラベルや精度の低い別 の訓練済みモデルなどの出力をもとにして作成した ラベルを用いて予測モデルを作成 Alex Ratner, Stephen Bach, Paroma Varma, Chris Ré And referencing work by many other members of Hazy Research. "Weak Supervision: The New Programming Paradigm for Machine Learning". 猫 猫
  9. 自己教師あり学習(self-supervised learning) 問題を解くために、何らかのラベルやデータの表現を自分で生成し、それを用いて問題を解く 予測モデル 出力 入力 猫の画像 猫 本当に解きたい問題に役立つラベルや表現を ラベルなしで学習して予測に活用する

    大量のラベルなしデータを用いて画像の特徴や表現 を学習し、それを踏まえて少数のラベルだけで他所 性能を向上させる https://www.slideshare.net/cvpaperchallenge/selfsupervised-learning-232896551 Λࢀর 猫 犬 ラベルなしデータ ラベルありデータ ※図では教師あり学習を例にしていますが、解きた いタスクが教師なしの問題である場合もあります
  10. トランスダクティブ学習(transductive inference) 教師ラベルがあるデータと予測したいテストデータが学習時に両方見える 予測モデル 訓練データ 出力 犬 猫 猫 既にあるテストデータに対して

    ラベルをつけることが問題となっている ㅟ ㅟ ㅟ ㅟ 限定されたテストデータに対してラベルを付与 していく ࢀߟจݙɿFoundations of Machine Learning Mehryar Mohri, Afshin Rostamizadeh, and Ameet Talwalkar MIT Press, Second Edition, 2018. 1.5 Learning scenariosͷ߲ テストデータ ?
  11. オンライン学習/逐次学習(sequential learning) ラベル付きデータを少しずつもらい、その度にパラメータを更新する 予測モデル 訓練データ 出力 犬 猫 猫 入力

    猫の画像 少しずつデータを使ってパラメータを更新、 全データを一括で入力する必要がない 少しずつパラメータを更新していくことで、 限られたリソースでも学習が可能になる。 新しくデータが追加された場合でも、もう一 度全データを用いて学習する必要が無い。 犬 猫 犬
  12. 強化学習(reinforcement learning) 環境から報酬(reward)を受け取り、それを最大化するような行動方法(方策)を学習する データ 環境から与えられる報酬を最大化することが目的 行動に対して報酬がもらえるので、そ れを最大化するようにするための方策 を学習する 犬3匹 猫2匹

    環境 66点! 50点 !
  13. 能動学習(active learning) 学習に役に立つデータを提示してラベルをつけてもらう 予測モデル データ 出力 入力 犬 猫 学習する上でラベルがあると有用なデータを見つけ

    出しそれにラベルをつけてもらうことで、より少な いデータで精度向上を目指す ? ? ? ラベルをつける人 は何? 猫でごわす ラベルをつけるべきデータをモデルが提示すること で、少データで高性能なモデルを目指す 猫の画像
  14. まとめ アルゴリズムを学習方法の視点から分類した時の呼び名について紹介しました •教師ラベルがどれくらい使用できるかを視点に分類している時がある •訓練と評価を繰り返す際の挙動や、環境への影響の有無の視点での分類もある •日々常に新しい課題が提案されてそれに伴い新しい学習方法も提案されている