Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Cpaw AI Competition 2nd CIFAR100/omniglot編
Search
Cpaw
April 02, 2018
Technology
0
160
Cpaw AI Competition 2nd CIFAR100/omniglot編
Cpaw
April 02, 2018
Tweet
Share
More Decks by Cpaw
See All by Cpaw
Cpaw AI Competition 2nd Programming/hand-RPS編
cpaw
0
160
Other Decks in Technology
See All in Technology
Google Cloud Next '24でブログを10本書いた方法と勉強会を沸かせた方法
yasumuusan
0
290
コンテナセキュリティの基本と脅威への対策
kyohmizu
3
750
ユーザーストーリーのレビューを自動化したみたの
bun913
1
410
ゼロから始めるVue.jsコミュニティ貢献 / first-vuejs-community-contribution-link-and-motivation
lmi
1
110
Compose Compiler Metricsを使った実践的なコードレビュー
tomorrowkey
1
220
非同期推論システムによるコスト削減と信頼性向上
koki_nishihara
0
100
GraphQL 成熟度モデルの紹介と、プロダクトに当てはめた事例 / GraphQL maturity model
mh4gf
7
1.3k
Kernel MemoryでAzure OpenAI Serviceとお手軽データソース連携
mitsuzono
1
180
Vertex AI を中心に 生成AIのアップデートを共有します
kaz1437
0
290
AOAI をきっかけに 社内の Azure 管理を見直した話
recruitengineers
PRO
1
250
DevOpsDays History and my DevOps story
kawaguti
PRO
9
2.4k
サーバー間 GraphQL と webmock-graphql の話 / server-to-server graphql and webmock-graphql
qsona
2
180
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
331
56k
WebSockets: Embracing the real-time Web
robhawkes
59
7k
Building an army of robots
kneath
300
41k
Teambox: Starting and Learning
jrom
128
8.4k
How GitHub Uses GitHub to Build GitHub
holman
468
290k
Build The Right Thing And Hit Your Dates
maggiecrowley
24
2k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
60
14k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
2
3.4k
Web Components: a chance to create the future
zenorocha
305
41k
Agile that works and the tools we love
rasmusluckow
325
20k
The Invisible Side of Design
smashingmag
294
49k
The Straight Up "How To Draw Better" Workshop
denniskardys
227
130k
Transcript
Cpaw AI Competition #2 問題解説 CIFAR100/Omniglot編 難しかった,すごく難しかったです
ごめんなさい、 昨晩問題見ました。 時間なかったけど 頑張ってみます…
今回の各タスクの印象 ▪ 画像認識タスク多め ▪ コスパ良い問題がいくつかある ▪ Omniglotツライ ▫ もはや画像検索タスク CIFAR100はリソースの範囲でうまくできるか
Omniglotはいい感じの画像類似度をつくれるか
1 CIFAR100 -一般物体認識タスク Praise Alex!
ベースラインをみてみよう グレースケール + Ridge Clsf. → 正解率7.68% 色ヒストグラム + Ridge
Clsf. → 正解率6.84% どう考えても難易度高すぎる やっぱりDeep Learning??
禁断のDeep Learning 5層CNN - conv(k=32)->relu - conv(k=32)->relu - maxpool ->
dropout (0.25) - conv(k=64) -> relu - conv(k=64) -> relu - maxpool -> dropout (0.25) - fc 512 -> relu - dropout 0.5 -> fc 100 →62.70% (validation data)
優勝者の方は??
2 Omniglot -文字画像検索タスク NOT One-shot Learning
ベースラインをみてみよう Nearest Neighbor → 正解率9.34% (8倍前正解率) どう考えても難易度高すぎる Cpawさん優しいので8倍です! ここからどう特徴量設計頑張る??
定番の次元圧縮系アルゴリズムにツッコむ - PCA + Nearest Neighbor: 14.2% (8倍前正解率) - 次元圧縮系で良さげなやつありましたか??
画像の”ハッシュ”をとる - Perceptual hash - Wavelet hash - Difference hash
- Average hash - などなど,imagehashライブラリに入っている! - Average hash + ハミング距離 + Nearest Neighbor: 17.01% (8倍前正解率) https://medium.com/taringa-on-publishing/why-we-built-imageid-and-saved-47-of-the- moderation-effort-b7afb69d068e
最強のオレオレモデル - ストローク特徴量: 19.21% (!!) (8倍前正解率) - 細線化 (Zhang-Suenアルゴリズム) -
隣接するピクセルを追跡して方向を記録しておく - クロスしたら後から戻ってくる (revisit) - 方向コード文字列で編集距離最短で検索 0 1 2
懇親会で情報交換しようぜ!