Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Cpaw AI Competition 2nd CIFAR100/omniglot編
Search
Cpaw
April 02, 2018
Technology
0
220
Cpaw AI Competition 2nd CIFAR100/omniglot編
Cpaw
April 02, 2018
Tweet
Share
More Decks by Cpaw
See All by Cpaw
Cpaw AI Competition 2nd Programming/hand-RPS編
cpaw
0
210
Other Decks in Technology
See All in Technology
Digitization部 紹介資料
sansan33
PRO
1
6.8k
茨城の思い出を振り返る ~CDKのセキュリティを添えて~ / 20260201 Mitsutoshi Matsuo
shift_evolve
PRO
1
270
Amazon Bedrock Knowledge Basesチャンキング解説!
aoinoguchi
0
140
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
270
OCI Database Management サービス詳細
oracle4engineer
PRO
1
7.4k
会社紹介資料 / Sansan Company Profile
sansan33
PRO
15
400k
GitHub Issue Templates + Coding Agentで簡単みんなでIaC/Easy IaC for Everyone with GitHub Issue Templates + Coding Agent
aeonpeople
1
220
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
450
Codex 5.3 と Opus 4.6 にコーポレートサイトを作らせてみた / Codex 5.3 vs Opus 4.6
ama_ch
0
150
今日から始めるAmazon Bedrock AgentCore
har1101
4
410
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
360
AWS Network Firewall Proxyを触ってみた
nagisa53
1
230
Featured
See All Featured
Design in an AI World
tapps
0
140
The Curious Case for Waylosing
cassininazir
0
240
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
110
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Being A Developer After 40
akosma
91
590k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
120
Unsuck your backbone
ammeep
671
58k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
Fireside Chat
paigeccino
41
3.8k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
Transcript
Cpaw AI Competition #2 問題解説 CIFAR100/Omniglot編 難しかった,すごく難しかったです
ごめんなさい、 昨晩問題見ました。 時間なかったけど 頑張ってみます…
今回の各タスクの印象 ▪ 画像認識タスク多め ▪ コスパ良い問題がいくつかある ▪ Omniglotツライ ▫ もはや画像検索タスク CIFAR100はリソースの範囲でうまくできるか
Omniglotはいい感じの画像類似度をつくれるか
1 CIFAR100 -一般物体認識タスク Praise Alex!
ベースラインをみてみよう グレースケール + Ridge Clsf. → 正解率7.68% 色ヒストグラム + Ridge
Clsf. → 正解率6.84% どう考えても難易度高すぎる やっぱりDeep Learning??
禁断のDeep Learning 5層CNN - conv(k=32)->relu - conv(k=32)->relu - maxpool ->
dropout (0.25) - conv(k=64) -> relu - conv(k=64) -> relu - maxpool -> dropout (0.25) - fc 512 -> relu - dropout 0.5 -> fc 100 →62.70% (validation data)
優勝者の方は??
2 Omniglot -文字画像検索タスク NOT One-shot Learning
ベースラインをみてみよう Nearest Neighbor → 正解率9.34% (8倍前正解率) どう考えても難易度高すぎる Cpawさん優しいので8倍です! ここからどう特徴量設計頑張る??
定番の次元圧縮系アルゴリズムにツッコむ - PCA + Nearest Neighbor: 14.2% (8倍前正解率) - 次元圧縮系で良さげなやつありましたか??
画像の”ハッシュ”をとる - Perceptual hash - Wavelet hash - Difference hash
- Average hash - などなど,imagehashライブラリに入っている! - Average hash + ハミング距離 + Nearest Neighbor: 17.01% (8倍前正解率) https://medium.com/taringa-on-publishing/why-we-built-imageid-and-saved-47-of-the- moderation-effort-b7afb69d068e
最強のオレオレモデル - ストローク特徴量: 19.21% (!!) (8倍前正解率) - 細線化 (Zhang-Suenアルゴリズム) -
隣接するピクセルを追跡して方向を記録しておく - クロスしたら後から戻ってくる (revisit) - 方向コード文字列で編集距離最短で検索 0 1 2
懇親会で情報交換しようぜ!