Slide 1

Slide 1 text

Cpaw AI Competition #2 問題解説 CIFAR100/Omniglot編 難しかった,すごく難しかったです

Slide 2

Slide 2 text

ごめんなさい、 昨晩問題見ました。 時間なかったけど 頑張ってみます…

Slide 3

Slide 3 text

今回の各タスクの印象 ▪ 画像認識タスク多め ▪ コスパ良い問題がいくつかある ▪ Omniglotツライ ▫ もはや画像検索タスク CIFAR100はリソースの範囲でうまくできるか Omniglotはいい感じの画像類似度をつくれるか

Slide 4

Slide 4 text

1 CIFAR100 -一般物体認識タスク Praise Alex!

Slide 5

Slide 5 text

ベースラインをみてみよう グレースケール + Ridge Clsf. → 正解率7.68% 色ヒストグラム + Ridge Clsf. → 正解率6.84% どう考えても難易度高すぎる やっぱりDeep Learning??

Slide 6

Slide 6 text

禁断のDeep Learning 5層CNN - conv(k=32)->relu - conv(k=32)->relu - maxpool -> dropout (0.25) - conv(k=64) -> relu - conv(k=64) -> relu - maxpool -> dropout (0.25) - fc 512 -> relu - dropout 0.5 -> fc 100 →62.70% (validation data)

Slide 7

Slide 7 text

優勝者の方は??

Slide 8

Slide 8 text

2 Omniglot -文字画像検索タスク NOT One-shot Learning

Slide 9

Slide 9 text

ベースラインをみてみよう Nearest Neighbor → 正解率9.34% (8倍前正解率) どう考えても難易度高すぎる Cpawさん優しいので8倍です! ここからどう特徴量設計頑張る??

Slide 10

Slide 10 text

定番の次元圧縮系アルゴリズムにツッコむ - PCA + Nearest Neighbor: 14.2% (8倍前正解率) - 次元圧縮系で良さげなやつありましたか??

Slide 11

Slide 11 text

画像の”ハッシュ”をとる - Perceptual hash - Wavelet hash - Difference hash - Average hash - などなど,imagehashライブラリに入っている! - Average hash + ハミング距離 + Nearest Neighbor: 17.01% (8倍前正解率) https://medium.com/taringa-on-publishing/why-we-built-imageid-and-saved-47-of-the- moderation-effort-b7afb69d068e

Slide 12

Slide 12 text

最強のオレオレモデル - ストローク特徴量: 19.21% (!!) (8倍前正解率) - 細線化 (Zhang-Suenアルゴリズム) - 隣接するピクセルを追跡して方向を記録しておく - クロスしたら後から戻ってくる (revisit) - 方向コード文字列で編集距離最短で検索 0 1 2

Slide 13

Slide 13 text

懇親会で情報交換しようぜ!