Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ゆるい論文紹介:CutMix
Search
Akira TSURUDA
July 17, 2019
Research
0
300
ゆるい論文紹介:CutMix
えだまめLT会発表資料
Akira TSURUDA
July 17, 2019
Tweet
Share
More Decks by Akira TSURUDA
See All by Akira TSURUDA
Sonyの一眼をWeb APIでhackする
kiakiraki
0
190
VSCodeのススメ
kiakiraki
0
32
Other Decks in Research
See All in Research
HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery
satai
3
190
機械学習と数理最適化の融合 (MOAI) による革新
mickey_kubo
1
410
不確実性下における目的と手段の統合的探索に向けた連続腕バンディットの応用 / iot70_gp_rff_mab
monochromegane
2
220
snlp2025_prevent_llm_spikes
takase
0
400
ロボット学習における大規模検索技術の展開と応用
denkiwakame
1
140
Sat2City:3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion
satai
4
220
ウェブ・ソーシャルメディア論文読み会 第31回: The rising entropy of English in the attention economy. (Commun Psychology, 2024)
hkefka385
1
110
Generative Models 2025
takahashihiroshi
25
14k
問いを起点に、社会と共鳴する知を育む場へ
matsumoto_r
PRO
0
680
[RSJ25] Enhancing VLA Performance in Understanding and Executing Free-form Instructions via Visual Prompt-based Paraphrasing
keio_smilab
PRO
0
160
EOGS: Gaussian Splatting for Efficient Satellite Image Photogrammetry
satai
4
760
MetaEarth: A Generative Foundation Model for Global-Scale Remote Sensing Image Generation
satai
4
380
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
4 Signs Your Business is Dying
shpigford
186
22k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
What's in a price? How to price your products and services
michaelherold
246
12k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Done Done
chrislema
186
16k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.7k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
The Language of Interfaces
destraynor
162
25k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.5k
Transcript
論文紹介:CutMix Regularization Strategy to Train Strong Classifiers with Localizable Features
https://arxiv.org/abs/1905.04899 https://github.com/clovaai/CutMix-PyTorch
はじめに • LTだし非エンジニアの方もいるので、 ゆるめに論文を紹介します • 最近の画像向けNeural Networkの正則化・Data Augmentation 手法の雰囲気を知って貰えれば…
目次 • 従来手法 • 従来手法の問題点 • 提案手法 • 実験 間に合いませんでしたゴメンナサイ
従来手法:Cutout (Random Erasing) • 画像中のランダムな矩形領域を単色 or ノイズで埋める • Dropoutを入力に対して適用するイメージ? https://arxiv.org/abs/1708.04896
https://arxiv.org/abs/1708.04552
従来手法: MixUp • 2つのデータを混合して新たなサンプルを作成する手法 • データだけでなく、ラベルを混合する点が特徴的 • 数値データにも有効 https://arxiv.org/abs/1809.02499 dog:
1.0 cat : 0.0 dog: 0.0 cat : 1.0 dog: 0.5 cat : 0.5
従来手法の問題点① • 重要な情報が欠損する可能性がある • 例:車種分類モデルの場合 Q:トヨタ86はどっち?
従来手法の問題点② • 合成画像が不自然になり、何を学習しているのか解釈しづらい プードルとセントバー ナードを見分けるタスク Mixup、Cutoutを適用 「セントバーナード」と回答 するときどこを見ているか 「プードル」と回答するとき どこを見ているか
提案手法: CutMix • CutoutとMixupの合わせ技 • Cutoutで切り取った領域に他クラスの 画像を合成
従来手法との精度比較 • 実験が間に合わなかったので論文の 結果 • Classification, Localization, Object Detection, Image
Captioningのタス クで従来手法よりも精度が向上
まとめ • 画像データの正則化手法としてCutout、Mixup等の手法が利用 されている • これらの手法は、タスクによっては逆効果になり得る • CutMixで解決! (らしい)