Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Cpaw AI Competition 2nd CIFAR100/omniglot編
Search
Cpaw
April 02, 2018
Technology
0
210
Cpaw AI Competition 2nd CIFAR100/omniglot編
Cpaw
April 02, 2018
Tweet
Share
More Decks by Cpaw
See All by Cpaw
Cpaw AI Competition 2nd Programming/hand-RPS編
cpaw
0
210
Other Decks in Technology
See All in Technology
業務のトイルをバスターせよ 〜AI時代の生存戦略〜
staka121
PRO
2
190
Microsoft Agent 365 についてゆっくりじっくり理解する!
skmkzyk
0
330
AIと二人三脚で育てた、個人開発アプリグロース術
zozotech
PRO
1
730
OCI Oracle Database Services新機能アップデート(2025/09-2025/11)
oracle4engineer
PRO
1
190
Snowflakeでデータ基盤を もう一度作り直すなら / rebuilding-data-platform-with-snowflake
pei0804
6
1.5k
AWS CLIの新しい認証情報設定方法aws loginコマンドの実態
wkm2
6
740
re:Invent2025 3つの Frontier Agents を紹介 / introducing-3-frontier-agents
tomoki10
0
110
MLflowダイエット大作戦
lycorptech_jp
PRO
1
120
プロンプトやエージェントを自動的に作る方法
shibuiwilliam
10
8k
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
sutotakeshi
0
500
寫了幾年 Code,然後呢?軟體工程師必須重新認識的 DevOps
cheng_wei_chen
1
1.4k
品質のための共通認識
kakehashi
PRO
3
260
Featured
See All Featured
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Code Reviewing Like a Champion
maltzj
527
40k
Visualization
eitanlees
150
16k
Embracing the Ebb and Flow
colly
88
4.9k
Bash Introduction
62gerente
615
210k
How GitHub (no longer) Works
holman
316
140k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
Done Done
chrislema
186
16k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Speed Design
sergeychernyshev
33
1.4k
Transcript
Cpaw AI Competition #2 問題解説 CIFAR100/Omniglot編 難しかった,すごく難しかったです
ごめんなさい、 昨晩問題見ました。 時間なかったけど 頑張ってみます…
今回の各タスクの印象 ▪ 画像認識タスク多め ▪ コスパ良い問題がいくつかある ▪ Omniglotツライ ▫ もはや画像検索タスク CIFAR100はリソースの範囲でうまくできるか
Omniglotはいい感じの画像類似度をつくれるか
1 CIFAR100 -一般物体認識タスク Praise Alex!
ベースラインをみてみよう グレースケール + Ridge Clsf. → 正解率7.68% 色ヒストグラム + Ridge
Clsf. → 正解率6.84% どう考えても難易度高すぎる やっぱりDeep Learning??
禁断のDeep Learning 5層CNN - conv(k=32)->relu - conv(k=32)->relu - maxpool ->
dropout (0.25) - conv(k=64) -> relu - conv(k=64) -> relu - maxpool -> dropout (0.25) - fc 512 -> relu - dropout 0.5 -> fc 100 →62.70% (validation data)
優勝者の方は??
2 Omniglot -文字画像検索タスク NOT One-shot Learning
ベースラインをみてみよう Nearest Neighbor → 正解率9.34% (8倍前正解率) どう考えても難易度高すぎる Cpawさん優しいので8倍です! ここからどう特徴量設計頑張る??
定番の次元圧縮系アルゴリズムにツッコむ - PCA + Nearest Neighbor: 14.2% (8倍前正解率) - 次元圧縮系で良さげなやつありましたか??
画像の”ハッシュ”をとる - Perceptual hash - Wavelet hash - Difference hash
- Average hash - などなど,imagehashライブラリに入っている! - Average hash + ハミング距離 + Nearest Neighbor: 17.01% (8倍前正解率) https://medium.com/taringa-on-publishing/why-we-built-imageid-and-saved-47-of-the- moderation-effort-b7afb69d068e
最強のオレオレモデル - ストローク特徴量: 19.21% (!!) (8倍前正解率) - 細線化 (Zhang-Suenアルゴリズム) -
隣接するピクセルを追跡して方向を記録しておく - クロスしたら後から戻ってくる (revisit) - 方向コード文字列で編集距離最短で検索 0 1 2
懇親会で情報交換しようぜ!