Cpaw AI Competition 2nd CIFAR100/omniglot編

Cpaw AI Competition #2 問題解説 CIFAR100/Omniglot編難しかった，すごく難しかったです

ごめんなさい、昨晩問題見ました。時間なかったけど頑張ってみます…

今回の各タスクの印象 ▪ 画像認識タスク多め ▪ コスパ良い問題がいくつかある ▪ Omniglotツライ ▫ もはや画像検索タスク CIFAR100はリソースの範囲でうまくできるか
Omniglotはいい感じの画像類似度をつくれるか

1 CIFAR100 -一般物体認識タスク Praise Alex!

ベースラインをみてみようグレースケール + Ridge Clsf. → 正解率7.68% 色ヒストグラム + Ridge
Clsf. → 正解率6.84% どう考えても難易度高すぎるやっぱりDeep Learning??

禁断のDeep Learning 5層CNN - conv(k=32)->relu - conv(k=32)->relu - maxpool ->
dropout (0.25) - conv(k=64) -> relu - conv(k=64) -> relu - maxpool -> dropout (0.25) - fc 512 -> relu - dropout 0.5 -> fc 100 →62.70% (validation data)

優勝者の方は？？

2 Omniglot -文字画像検索タスク NOT One-shot Learning

ベースラインをみてみよう Nearest Neighbor → 正解率9.34% (8倍前正解率) どう考えても難易度高すぎる Cpawさん優しいので8倍です！ここからどう特徴量設計頑張る??

定番の次元圧縮系アルゴリズムにツッコむ - PCA + Nearest Neighbor: 14.2% (8倍前正解率) - 次元圧縮系で良さげなやつありましたか??

画像の”ハッシュ”をとる - Perceptual hash - Wavelet hash - Difference hash
- Average hash - などなど，imagehashライブラリに入っている！ - Average hash + ハミング距離 + Nearest Neighbor: 17.01% (8倍前正解率) https://medium.com/taringa-on-publishing/why-we-built-imageid-and-saved-47-of-the- moderation-effort-b7afb69d068e

最強のオレオレモデル - ストローク特徴量: 19.21% (!!) (8倍前正解率) - 細線化 (Zhang-Suenアルゴリズム) -
隣接するピクセルを追跡して方向を記録しておく - クロスしたら後から戻ってくる (revisit) - 方向コード文字列で編集距離最短で検索 0 1 2

懇親会で情報交換しようぜ！

Cpaw AI Competition 2nd CIFAR100/omniglot編

Cpaw AI Competition 2nd CIFAR100/omniglot編

Cpaw

More Decks by Cpaw

Other Decks in Technology

Featured

Transcript

Cpaw AI Competition #2 問題解説 CIFAR100/Omniglot編難しかった，すごく難しかったです

ごめんなさい、昨晩問題見ました。時間なかったけど頑張ってみます…

今回の各タスクの印象 ▪ 画像認識タスク多め ▪ コスパ良い問題がいくつかある ▪ Omniglotツライ ▫ もはや画像検索タスク CIFAR100はリソースの範囲でうまくできるか

1 CIFAR100 -一般物体認識タスク Praise Alex!

ベースラインをみてみようグレースケール + Ridge Clsf. → 正解率7.68% 色ヒストグラム + Ridge

禁断のDeep Learning 5層CNN - conv(k=32)->relu - conv(k=32)->relu - maxpool ->

優勝者の方は？？

2 Omniglot -文字画像検索タスク NOT One-shot Learning

ベースラインをみてみよう Nearest Neighbor → 正解率9.34% (8倍前正解率) どう考えても難易度高すぎる Cpawさん優しいので8倍です！ここからどう特徴量設計頑張る??

定番の次元圧縮系アルゴリズムにツッコむ - PCA + Nearest Neighbor: 14.2% (8倍前正解率) - 次元圧縮系で良さげなやつありましたか??

画像の”ハッシュ”をとる - Perceptual hash - Wavelet hash - Difference hash

最強のオレオレモデル - ストローク特徴量: 19.21% (!!) (8倍前正解率) - 細線化 (Zhang-Suenアルゴリズム) -

懇親会で情報交換しようぜ！