Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Cpaw AI Competition 2nd CIFAR100/omniglot編
Search
Cpaw
April 02, 2018
Technology
0
200
Cpaw AI Competition 2nd CIFAR100/omniglot編
Cpaw
April 02, 2018
Tweet
Share
More Decks by Cpaw
See All by Cpaw
Cpaw AI Competition 2nd Programming/hand-RPS編
cpaw
0
190
Other Decks in Technology
See All in Technology
【Oracle Cloud ウェビナー】インフラのプロフェッショナル集団KELが考えるOCIでのソリューション実現
oracle4engineer
PRO
1
100
Lazy application authentication with Tailscale
bluehatbrit
0
220
LangChain Interrupt & LangChain Ambassadors meetingレポート
os1ma
2
320
NewSQLや分散データベースを支えるRaftの仕組み - 仕組みを理解して知る得意不得意
hacomono
PRO
3
180
CRE Camp #1 エンジニアリングを民主化するCREチームでありたい話
mntsq
1
140
事業成長の裏側:エンジニア組織と開発生産性の進化 / 20250703 Rinto Ikenoue
shift_evolve
PRO
3
22k
面倒な作業はAIにおまかせ。Flutter開発をスマートに効率化
ruideengineer
0
270
赤煉瓦倉庫勉強会「Databricksを選んだ理由と、絶賛真っ只中のデータ基盤移行体験記」
ivry_presentationmaterials
2
370
Geminiとv0による高速プロトタイピング
shinya337
1
280
Claude Code に プロジェクト管理やらせたみた
unson
6
4.5k
AWS認定を取る中で感じたこと
siromi
1
190
マネジメントって難しい、けどおもしろい / Management is tough, but fun! #em_findy
ar_tama
7
1.1k
Featured
See All Featured
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
357
30k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
960
Building a Modern Day E-commerce SEO Strategy
aleyda
42
7.4k
The Pragmatic Product Professional
lauravandoore
35
6.7k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
The Cost Of JavaScript in 2023
addyosmani
51
8.5k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Facilitating Awesome Meetings
lara
54
6.4k
Designing Experiences People Love
moore
142
24k
Building Applications with DynamoDB
mza
95
6.5k
The Invisible Side of Design
smashingmag
301
51k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Transcript
Cpaw AI Competition #2 問題解説 CIFAR100/Omniglot編 難しかった,すごく難しかったです
ごめんなさい、 昨晩問題見ました。 時間なかったけど 頑張ってみます…
今回の各タスクの印象 ▪ 画像認識タスク多め ▪ コスパ良い問題がいくつかある ▪ Omniglotツライ ▫ もはや画像検索タスク CIFAR100はリソースの範囲でうまくできるか
Omniglotはいい感じの画像類似度をつくれるか
1 CIFAR100 -一般物体認識タスク Praise Alex!
ベースラインをみてみよう グレースケール + Ridge Clsf. → 正解率7.68% 色ヒストグラム + Ridge
Clsf. → 正解率6.84% どう考えても難易度高すぎる やっぱりDeep Learning??
禁断のDeep Learning 5層CNN - conv(k=32)->relu - conv(k=32)->relu - maxpool ->
dropout (0.25) - conv(k=64) -> relu - conv(k=64) -> relu - maxpool -> dropout (0.25) - fc 512 -> relu - dropout 0.5 -> fc 100 →62.70% (validation data)
優勝者の方は??
2 Omniglot -文字画像検索タスク NOT One-shot Learning
ベースラインをみてみよう Nearest Neighbor → 正解率9.34% (8倍前正解率) どう考えても難易度高すぎる Cpawさん優しいので8倍です! ここからどう特徴量設計頑張る??
定番の次元圧縮系アルゴリズムにツッコむ - PCA + Nearest Neighbor: 14.2% (8倍前正解率) - 次元圧縮系で良さげなやつありましたか??
画像の”ハッシュ”をとる - Perceptual hash - Wavelet hash - Difference hash
- Average hash - などなど,imagehashライブラリに入っている! - Average hash + ハミング距離 + Nearest Neighbor: 17.01% (8倍前正解率) https://medium.com/taringa-on-publishing/why-we-built-imageid-and-saved-47-of-the- moderation-effort-b7afb69d068e
最強のオレオレモデル - ストローク特徴量: 19.21% (!!) (8倍前正解率) - 細線化 (Zhang-Suenアルゴリズム) -
隣接するピクセルを追跡して方向を記録しておく - クロスしたら後から戻ってくる (revisit) - 方向コード文字列で編集距離最短で検索 0 1 2
懇親会で情報交換しようぜ!