Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Cpaw AI Competition 2nd CIFAR100/omniglot編

473e3755004fd21a59ba460f515c3ed8?s=47 Cpaw
April 02, 2018

Cpaw AI Competition 2nd CIFAR100/omniglot編

473e3755004fd21a59ba460f515c3ed8?s=128

Cpaw

April 02, 2018
Tweet

Transcript

  1. Cpaw AI Competition #2 問題解説 CIFAR100/Omniglot編 難しかった,すごく難しかったです

  2. ごめんなさい、 昨晩問題見ました。 時間なかったけど 頑張ってみます…

  3. 今回の各タスクの印象 ▪ 画像認識タスク多め ▪ コスパ良い問題がいくつかある ▪ Omniglotツライ ▫ もはや画像検索タスク CIFAR100はリソースの範囲でうまくできるか

    Omniglotはいい感じの画像類似度をつくれるか
  4. 1 CIFAR100 -一般物体認識タスク Praise Alex!

  5. ベースラインをみてみよう グレースケール + Ridge Clsf. → 正解率7.68% 色ヒストグラム + Ridge

    Clsf. → 正解率6.84% どう考えても難易度高すぎる やっぱりDeep Learning??
  6. 禁断のDeep Learning 5層CNN - conv(k=32)->relu - conv(k=32)->relu - maxpool ->

    dropout (0.25) - conv(k=64) -> relu - conv(k=64) -> relu - maxpool -> dropout (0.25) - fc 512 -> relu - dropout 0.5 -> fc 100 →62.70% (validation data)
  7. 優勝者の方は??

  8. 2 Omniglot -文字画像検索タスク NOT One-shot Learning

  9. ベースラインをみてみよう Nearest Neighbor → 正解率9.34% (8倍前正解率) どう考えても難易度高すぎる Cpawさん優しいので8倍です! ここからどう特徴量設計頑張る??

  10. 定番の次元圧縮系アルゴリズムにツッコむ - PCA + Nearest Neighbor: 14.2% (8倍前正解率) - 次元圧縮系で良さげなやつありましたか??

  11. 画像の”ハッシュ”をとる - Perceptual hash - Wavelet hash - Difference hash

    - Average hash - などなど,imagehashライブラリに入っている! - Average hash + ハミング距離 + Nearest Neighbor: 17.01% (8倍前正解率) https://medium.com/taringa-on-publishing/why-we-built-imageid-and-saved-47-of-the- moderation-effort-b7afb69d068e
  12. 最強のオレオレモデル - ストローク特徴量: 19.21% (!!) (8倍前正解率) - 細線化 (Zhang-Suenアルゴリズム) -

    隣接するピクセルを追跡して方向を記録しておく - クロスしたら後から戻ってくる (revisit) - 方向コード文字列で編集距離最短で検索 0 1 2
  13. 懇親会で情報交換しようぜ!