Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ゆるい論文紹介:CutMix
Search
Akira TSURUDA
July 17, 2019
Research
0
180
ゆるい論文紹介:CutMix
えだまめLT会発表資料
Akira TSURUDA
July 17, 2019
Tweet
Share
More Decks by Akira TSURUDA
See All by Akira TSURUDA
Sonyの一眼をWeb APIでhackする
kiakiraki
0
130
VSCodeのススメ
kiakiraki
0
20
Other Decks in Research
See All in Research
AIを前提とした体験の実現に向けて/toward_ai_based_experiences
monochromegane
1
240
F0に基づいて伸縮された画像文字からの音声合成 [ASJ2024春]
nehi0615
0
120
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3
shunk031
0
460
Source Code Diff Revolution (JetBrains Open Reading Club)
tsantalis
0
260
Alternative Photographic Processes Reimagined: The Role of Digital Technology in Revitalizing Classic Printing Techniques【SIGGRAPH Asia 2023】
toremolo72
0
430
FMP L3 Year 1 Project Proposal
haiinya
0
150
10-ot-generic-bio.pdf
gpeyre
0
140
メタ動画データセットによる動作認識の現状と可能性
yuyay
0
180
200名の育児中男性の声 「僕たちは、キャリアとライフをトレードオフにしたくない」共働き3.0世代の男性が 本当に求める働き方とは【ワーキングペアレンツの転職意識調査2023|XTalent株式会社】
xtalent
0
480
「EBPMエコシステム」の可能性
daimoriwaki
0
200
VAR モデルによる OSS プロジェクト同士が生存性に与える 影響の分析
noppoman
0
130
インタビューだけじゃない!ユーザーに共感しユーザーの目👀を手に入れるためのインプット
moco1013
0
240
Featured
See All Featured
Fireside Chat
paigeccino
21
2.6k
Designing on Purpose - Digital PM Summit 2013
jponch
110
6.5k
GraphQLとの向き合い方2022年版
quramy
32
12k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
221
21k
WebSockets: Embracing the real-time Web
robhawkes
59
7k
Teambox: Starting and Learning
jrom
128
8.4k
Atom: Resistance is Futile
akmur
259
25k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
357
22k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3.1k
The Mythical Team-Month
searls
216
42k
Designing for humans not robots
tammielis
248
25k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
60
14k
Transcript
論文紹介:CutMix Regularization Strategy to Train Strong Classifiers with Localizable Features
https://arxiv.org/abs/1905.04899 https://github.com/clovaai/CutMix-PyTorch
はじめに • LTだし非エンジニアの方もいるので、 ゆるめに論文を紹介します • 最近の画像向けNeural Networkの正則化・Data Augmentation 手法の雰囲気を知って貰えれば…
目次 • 従来手法 • 従来手法の問題点 • 提案手法 • 実験 間に合いませんでしたゴメンナサイ
従来手法:Cutout (Random Erasing) • 画像中のランダムな矩形領域を単色 or ノイズで埋める • Dropoutを入力に対して適用するイメージ? https://arxiv.org/abs/1708.04896
https://arxiv.org/abs/1708.04552
従来手法: MixUp • 2つのデータを混合して新たなサンプルを作成する手法 • データだけでなく、ラベルを混合する点が特徴的 • 数値データにも有効 https://arxiv.org/abs/1809.02499 dog:
1.0 cat : 0.0 dog: 0.0 cat : 1.0 dog: 0.5 cat : 0.5
従来手法の問題点① • 重要な情報が欠損する可能性がある • 例:車種分類モデルの場合 Q:トヨタ86はどっち?
従来手法の問題点② • 合成画像が不自然になり、何を学習しているのか解釈しづらい プードルとセントバー ナードを見分けるタスク Mixup、Cutoutを適用 「セントバーナード」と回答 するときどこを見ているか 「プードル」と回答するとき どこを見ているか
提案手法: CutMix • CutoutとMixupの合わせ技 • Cutoutで切り取った領域に他クラスの 画像を合成
従来手法との精度比較 • 実験が間に合わなかったので論文の 結果 • Classification, Localization, Object Detection, Image
Captioningのタス クで従来手法よりも精度が向上
まとめ • 画像データの正則化手法としてCutout、Mixup等の手法が利用 されている • これらの手法は、タスクによっては逆効果になり得る • CutMixで解決! (らしい)