Slide 1

Slide 1 text

Ridge-i インターンシッププログラム 人工知能・機械学習(AI/ML)基礎講座 第8話 機械学習用のデータ収集方法 Chief Research Officer 牛久 祥孝

Slide 2

Slide 2 text

1.3.2. 機械学習のその他の展開

Slide 3

Slide 3 text

機械学習のその他の展開 • 機械学習は非常に広範な分野 • 本小節では – 2.1節で扱う機械学習の基礎 – 3章以降で扱う深層学習 以外での機械学習の展開として以下の項目について紹介する – クラウドソーシングと機械学習 – プライバシー保護と機械学習 – 説明性のある機械学習 – 異常検出 – トピックモデル – 因果探索

Slide 4

Slide 4 text

そもそも学習用のデータをどう集める? • 研究開発者自身が収集 – 作業コストが膨大 • シミュレーションデータ作成 – リアルなビデオゲーム画像とそのレ ンダリングデータの対で学習 – 自動でデータを作れるが、実世界と 乖離がある場合も多い • クラウドソーシング – Amazon Mechanical Turk (AMT)など が有名 – 世界中の作業者(worker)に 対して発注者(requester)が 単純作業(マイクロタスク)を依頼 [https://docs.aws.amazon.com/AWSMechTurk/latest/RequesterUI/images/AWS-Mturk-Create-Tab-Tag-Image.jpg]

Slide 5

Slide 5 text

ヒューマンコンピュテーションとクラウドソーシング • ヒューマンコンピュテーション – 機械自身が遂行するのが 難しいタスクを人間に 肩代わりしてもらう枠組み – 例:reCAPTCHA 文字認識や画像認識を対象に、機械が答えを 知っているものと知らないものを同時に提示 • 紙媒体の電子化の作業を直接手伝っている場合もある • 何らかのサービスを利用するためという動機付けもできている • クラウドソーシングと機械学習 – 人間がラベルを付ける動機付け(AMTであれば報酬) – ラベル付けの誤りを修正する重み付き投票などの機械学習技術