Upgrade to Pro — share decks privately, control downloads, hide ads and more …

機械学習における様々な学習方法について違いを理解する

K_DM
September 20, 2021

 機械学習における様々な学習方法について違いを理解する

以下にリストアップした様々な○○学習という言葉について、それがどういうものを指しているのかを概説します。動画での説明:https://youtu.be/8gBIgYTFFLs

・教師あり学習(supervised learning)
・教師なし学習(unsupervised learning)
・半教師あり学習(semi-supervised learning)
・弱教師あり学習(weak-supervised learning)
・自己教師あり学習(self-supervised learning)
・トランスダクティブ学習 (transductive inference)
・オンライン学習(sequential learning)
・強化学習(reinforcement learning)
・能動学習(active learning)

K_DM

September 20, 2021
Tweet

More Decks by K_DM

Other Decks in Technology

Transcript

  1. 『問題設定』とは アルゴリズムの入力と出力を定義して、解決する課題を示したもの アルゴリズム・関数 入力 出力 データ 画像・映像 教師ラベル 数値 分類

    画像の領域 :FTɾ/P   ʜ 入力・出力をどのように使用するかに依って アルゴリズムの種類を分類分けすることができる
  2. 教師あり学習(supervised learning) すべてのデータに対してラベルが付いた学習データを用いて予測モデルを訓練 予測モデル 訓練データ 出力 犬 猫 犬 猫

    入力 訓練データの画像ひとつひとつに、 それが何の画像であるかの正解ラベルが付いている データを入力として受け取ると正しいラベルを 出力できるようにパラメータを調整する 猫の画像
  3. 教師なし学習(unsupervised learning) ラベルが付いていないデータを用いて予測モデルを作成 予測モデル データ 出力 入力 と は同じグループ データにラベルは付いていないが、

    データをもとに何らかの予測・構造化を行う データをまとめたりデータを分解した りして、意味のある構造を見つけ出す 猫の画像
  4. 半教師あり学習(semi-supervised learning) 教師ラベルがあるデータと無いデータを両方使って予測モデルを訓練 予測モデル データ 出力 入力 猫の画像 犬 猫

    ? 猫 データは大量にあるが、 データにラベルをつけるのが非常に高コスト データにどのようなものがあるか・どのような分布 でデータが存在しているかを知り、予測に役立てる Chapelle, Olivier, Bernhard Scholkopf, and Alexander Zien. "Semi-supervised learning (chapelle, o. et al., eds.; 2006)[book reviews]." IEEE Transactions on Neural Networks 20.3 (2009): 542-542.
  5. 弱教師あり学習(weak-supervised learning) 完全に正解とは限らないラベルを用いて予測モデルを学習 予測モデル データとweak-label 出力 入力 猫の画像 犬 猫

    猫 クラウドソーシングで集めたデータなど、 ラベルが不正確であり、完全なラベルが得られない クラウドワーカーの作成したラベルや精度の低い別 の訓練済みモデルなどの出力をもとにして作成した ラベルを用いて予測モデルを作成 Alex Ratner, Stephen Bach, Paroma Varma, Chris Ré And referencing work by many other members of Hazy Research. "Weak Supervision: The New Programming Paradigm for Machine Learning". 猫 猫
  6. 自己教師あり学習(self-supervised learning) 問題を解くために、何らかのラベルやデータの表現を自分で生成し、それを用いて問題を解く 予測モデル 出力 入力 猫の画像 猫 本当に解きたい問題に役立つラベルや表現を ラベルなしで学習して予測に活用する

    大量のラベルなしデータを用いて画像の特徴や表現 を学習し、それを踏まえて少数のラベルだけで他所 性能を向上させる https://www.slideshare.net/cvpaperchallenge/selfsupervised-learning-232896551 Λࢀর 猫 犬 ラベルなしデータ ラベルありデータ ※図では教師あり学習を例にしていますが、解きた いタスクが教師なしの問題である場合もあります
  7. トランスダクティブ学習(transductive inference) 教師ラベルがあるデータと予測したいテストデータが学習時に両方見える 予測モデル 訓練データ 出力 犬 猫 猫 既にあるテストデータに対して

    ラベルをつけることが問題となっている ㅟ ㅟ ㅟ ㅟ 限定されたテストデータに対してラベルを付与 していく ࢀߟจݙɿFoundations of Machine Learning Mehryar Mohri, Afshin Rostamizadeh, and Ameet Talwalkar MIT Press, Second Edition, 2018. 1.5 Learning scenariosͷ߲ テストデータ ?
  8. オンライン学習/逐次学習(sequential learning) ラベル付きデータを少しずつもらい、その度にパラメータを更新する 予測モデル 訓練データ 出力 犬 猫 猫 入力

    猫の画像 少しずつデータを使ってパラメータを更新、 全データを一括で入力する必要がない 少しずつパラメータを更新していくことで、 限られたリソースでも学習が可能になる。 新しくデータが追加された場合でも、もう一 度全データを用いて学習する必要が無い。 犬 猫 犬
  9. 能動学習(active learning) 学習に役に立つデータを提示してラベルをつけてもらう 予測モデル データ 出力 入力 犬 猫 学習する上でラベルがあると有用なデータを見つけ

    出しそれにラベルをつけてもらうことで、より少な いデータで精度向上を目指す ? ? ? ラベルをつける人 は何? 猫でごわす ラベルをつけるべきデータをモデルが提示すること で、少データで高性能なモデルを目指す 猫の画像