Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実用 Confident Learning
Search
Asei Sugiyama
October 13, 2022
Technology
2
3.8k
実用 Confident Learning
みんなのPython勉強会#86 での発表資料です
https://speakerdeck.com/asei/confident-learning
よりも事例の紹介に注力しています
Asei Sugiyama
October 13, 2022
Tweet
Share
More Decks by Asei Sugiyama
See All by Asei Sugiyama
AI との良い付き合い方を僕らは誰も知らない (WSS 2026 静岡版)
asei
1
460
AI との良い付き合い方を僕らは誰も知らない
asei
1
450
最近の生成 AI の活用事例紹介
asei
3
330
AI エージェント活用のベストプラクティスと今後の課題
asei
2
640
エージェントの継続的改善のためのメトリクス再考
asei
3
810
生成AI活用のベストプラクティス集を作ってる件
asei
1
880
GenAIOps: 生成AI時代の DevOps
asei
0
88
生成AI活用の実践解説 (速報版)
asei
1
1.7k
実践AIガバナンス
asei
3
1.1k
Other Decks in Technology
See All in Technology
コミュニティが変えるキャリアの地平線:コロナ禍新卒入社のエンジニアがAWSコミュニティで見つけた成長の羅針盤
kentosuzuki
0
120
広告の効果検証を題材にした因果推論の精度検証について
zozotech
PRO
0
190
顧客との商談議事録をみんなで読んで顧客解像度を上げよう
shibayu36
0
250
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
460
外部キー制約の知っておいて欲しいこと - RDBMSを正しく使うために必要なこと / FOREIGN KEY Night
soudai
PRO
12
5.5k
15 years with Rails and DDD (AI Edition)
andrzejkrzywda
0
200
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
1.9k
【Ubie】AIを活用した広告アセット「爆速」生成事例 | AI_Ops_Community_Vol.2
yoshiki_0316
1
100
Bill One 開発エンジニア 紹介資料
sansan33
PRO
5
17k
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
3.9k
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
ランサムウェア対策としてのpnpm導入のススメ
ishikawa_satoru
0
150
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
85
9.4k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
410
A Modern Web Designer's Workflow
chriscoyier
698
190k
Between Models and Reality
mayunak
1
190
Fireside Chat
paigeccino
41
3.8k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.2k
Darren the Foodie - Storyboard
khoart
PRO
2
2.4k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
Deep Space Network (abreviated)
tonyrice
0
49
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
130
How GitHub (no longer) Works
holman
316
140k
Transcript
Confident Learning Asei Sugiyama
TOC Data-centric AI 振り返り <- Confident Learning 概要 実践 Confident
Learning
Data-centric AI 振り返り Data-centric AI Confident Learning Data Perf
Data-centric AI データの改善に着目したム ーブメント モデルよりもデータの改善 のほうが効果的という Andrew Ng の過去の経験に 基づく
2021 年 12 月に大きなワー クショップが行われた
Confident Learning ワークショップの中で紹介 された取り組みの 1 つ データセットに含まれるラ ベルの誤りを検出 詳細は後述
Data Perf ML Perf: 機械学習アルゴリ ズムのベンチマーク Data Perf: データセットのベ ンチマーク
いずれはアルゴリズム - テ スト - データセットをすべ てインクリメンタルに改善 するフレームワークを提供 するという野心的な提案
TOC Data-centric AI 振り返り Confident Learning 概要 <- 実践 Confident
Learning
Confident Learning 概要 背景 論文の内容 手法 結果 Pervasive Label Errors
in Test Sets Destabilize Machine Learning Benchmarks https://arxiv.org/abs/2103.14749
背景 Hinton が MNIST (LeCun が作成) の 誤り 1 件を見つけて喜んでいるのを
見ていた 「こんなに有名な人がこんなに喜ん でいるのならこれは価値があるので は」と思ったのがきっかけ Cleanlab: Labeled Datasets that Correct Themselves Automatically // Curtis Northcutt // MLOps Coffee Sessions #105 https://anchor.fm/mlops/episodes/Cleanlab-Labeled- Datasets-that-Correct-Themselves-Automatically--Curtis-Northcutt--MLOps-Coffee- Sessions-105-e1k777l/a-a850eq6
論文の内容 Confident Learning という 手法を提案 多クラス分類において、既 存の手法よりも効率的にラ ベルの誤りを発見 MNIST, ImageNet
などのデ ータセットにラベルの誤り を実際に発見した Pervasive Label Errors in Test Sets Destabilize Machine Learning Benchmarks https://arxiv.org/abs/2103.14749
手法 データセットを用いてモデ ルを訓練 & 推論 (k-fold) 推論結果に Confident Learning を適用し、誤りが
疑われるデータの一覧を作 成 Amazon Mechanical Turk で改めてアノテーション Pervasive Label Errors in Test Sets Destabilize Machine Learning Benchmarks https://arxiv.org/abs/2103.14749
結果: データセットの誤り率 Pervasive Label Errors in Test Sets Destabilize Machine
Learning Benchmarks https://arxiv.org/abs/2103.14749
結果: 提案のワークフローで発生する見逃し Pervasive Label Errors in Test Sets Destabilize Machine
Learning Benchmarks https://arxiv.org/abs/2103.14749
どうしようもない例 右の画像は ImageNet で tick (ダニ) とラベル付けされたもの クラウドソーシングで scorpion とラ
ベルが振り直された 実際は Solifugae (ヒヨケムシ、クモ やサソリではない)
TOC Data-centric AI 振り返り Confident Learning 概要 実践 Confident Learning
<-
背景 画像から疾病の陽性/陰性を判定する機械学習モデルを構築中 陽性/陰性の判定には高い専門性が必要なため、少数の専門家 (医療業務 従事者) が画像をアノテーション 構築したデータセットをもとに画像から陽性/陰性を判定するモデルを構 築 テストデータにおいてモデルが誤った画像について、専門家に念のため の再確認したところ、機械学習モデルの判断のほうが正しかったという
結果に
問題 構築した画像データセットに誤りがどの程度含まれているのか不明 データセットに含まれる画像が 4,000 件あり、今後も増える予定 専門家が全件チェックするのは現実的でないし、全件チェックした結果 を信用してよいのかどうかも不明
目標 1. アノテーションの結果がどの程度信用できるのか見積もること 2. データセットに含まれる誤りを効率的に修正するための手法を確立する こと
Clean Lab Confident Learning の OSS 実装 Python から利用可能 cleanlab/cleanlab
https://github.com/cleanlab/cleanlab
コード アルゴリズムはモデルの出力のみを用いるため、幅広い分類モデルを利 用可能 from cleanlab.filter import find_label_issues ordered_label_issues = find_label_issues(
labels=labels, pred_probs=pred_probs, return_indices_ranked_by='self_confidence', )
結果 画像 4000 枚から40件の誤りを特定、修正できた 種別 枚数 割合 全画像 4000 枚
100% Confident Learning により抽出した画像 250 枚 6.25% 再レビューの結果、陽性/陰性が修正された件数 40 枚 1%
考察 アノテーションの誤りは概ね正しく抽出できていると思われる 今回のデータセットにおいて検出できた誤りは 1% 程度 これは公開されている品質の高いデータセットとほとんど同じ アノテーションの誤りを効率的に修正する手法は確立できた レビュー対象を 4,000 枚から
250 枚 (6%) に集約できた 見逃しもあると思われるため、データの収集と修正を繰り返し実施する 必要性も明らかになった
まとめ Confident Learning はラベルの誤りを発見することでデータの品質向上 に取り組むアルゴリズム ImageNet などのデータセットに対してアルゴリズムを適用することで 実際に誤りを発見 アルゴリズムを実際のデータセットに適用してみたところ、誤りを発見 し、修正できた