Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20分で分かる Human-in-the-Loop 機械学習におけるアノテーションとヒューマン...

20分で分かる Human-in-the-Loop 機械学習におけるアノテーションとヒューマンコンピューターインタラクションの真髄

第8回 Data-Centric AI勉強会 ~Human-in-the-Loop機械学習 特別回~の発表内容です。
https://dcai-jp.connpass.com/event/315963/

書籍「Human-in-the-Loop 機械学習」において、翻訳を担当した章(1,7,8,11,12章)の内容を抜粋して紹介します。Human in the loop 機械学習において重要な概念であるアノテーションとヒューマンコンピューターインタラクションについて、著者の機械学習エンジニアとしての実例を交えつつ説明します。

Amazon での書籍リンク
https://amzn.to/47u5tFz

Shunya Ueta

May 09, 2024
Tweet

More Decks by Shunya Ueta

Other Decks in Science

Transcript

  1. 自己紹介 上田隼也 @hurutoriya 書籍「Human in the Loop 機械学習」の翻訳の発起人 2018 年に株式会社メルカリに機械学習エンジニアとして入社後、機械学習による商品監

    視サービスの改善を推進。 その結果を論文としてまとめた「Auto Content Moderation in C2C e-Commerce」が、 MLOps の査読付き国際会議 OpML'20 に採択された。 2021 年から検索チームに異動し、検索エンジニアとしてメルカリの検索サービスの改善 に取り組んでいる。趣味で検索エンジン OSS 勉強会というオンライン勉強会を主催して いる。 2
  2. Human-in-the-Loop 機械学習とは 原著: Human-in-the-Loop Machine Learning Active learning and annotation

    for human-centered AI 2021 年 6 月に出版、2023 年 12 月に日本語翻訳書籍(400 頁弱!)を出版 Human-in-the-Loop 機械学習の定義 機械学習モデルと人間が相互補完しながら動作するシステム。本書ではデータの作成を Human-in-the-Loop 機械学習によって行う方法について取り上げる 1. Human-in-the-Loop 機械学習の概要(1,2 章) 2. 能動学習(3,4,5,6 章) 3. アノテーション(7,8,9,10 章) 4. 機械学習のためのヒューマンコンピュータインタラクション(11,12 章) 7
  3. まとめ Garbage in Garbage out 機械学習をやる前にまずはデータを集めよう 機械学習はデータを持ってるところが勝つ 競合優位性は所有しているデータから生まれる Human-in-the-Loop 機械学習はデータ作成に主眼を当てた珍しい書籍

    だが、10 年後でも色褪せない意義のある内容 大規模言語モデル(LLM)の時代である今でも色褪せない...と信じてます! 今回の発表で少しでも気になったら買ってくれると嬉しいです! 25