Slide 1

Slide 1 text

Data-centric AI入門 画像認識におけるData-centric AI OMRON SINIC X Senior Researcher 齋藤邦章

Slide 2

Slide 2 text

• 画像認識におけるData-Centric AI • 画像認識モデルの基礎知識 • データを拡張、生成する技術 • 不完全アノテーションからの学習 • 画像と言語ペアの関係性を学習した基盤モデル • 能動学習 2 2章の概要

Slide 3

Slide 3 text

2章の概要 • 画像認識におけるData-Centric AI • 画像認識モデルの基礎知識 • データを拡張、生成する技術 • 不完全アノテーションからの学習 • 画像と言語ペアの関係性を学習した基盤モデル • 能動学習 3 「データを如何にデザインするか?」 に注目して研究事例を多く取り上げる.

Slide 4

Slide 4 text

2.3 データを拡張、生成する技術 • データ拡張の方法とその効果について研究事例を通して議論 4 物体検出におけるデータ拡張 (copy-paste) ロバストさを高めるためのデータ拡張 (Augmix) Ghiasi et.al., 2021, Hendrycks et.al., 2019

Slide 5

Slide 5 text

2.4 不完全アノテーションからの学習 • 自己教師あり学習と半教師あり学習 – データ拡張を利用した学習手法 5

Slide 6

Slide 6 text

2.5 画像と言語ペアの関係性を学習した基盤モデル 6 BLIPにおけるデータ収集のパイプライン • Webから収集した画像ー言語ペアをどう学習データとして利用しているか?

Slide 7

Slide 7 text

2.6 能動学習 • 予測の不確かさ (Uncertainty), データの多様性 (Diversity) 7