$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ゆるい論文紹介:CutMix
Search
Akira TSURUDA
July 17, 2019
Research
0
310
ゆるい論文紹介:CutMix
えだまめLT会発表資料
Akira TSURUDA
July 17, 2019
Tweet
Share
More Decks by Akira TSURUDA
See All by Akira TSURUDA
Sonyの一眼をWeb APIでhackする
kiakiraki
0
200
VSCodeのススメ
kiakiraki
0
32
Other Decks in Research
See All in Research
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
130
CVPR2025論文紹介:Unboxed
murakawatakuya
0
230
ForestCast: Forecasting Deforestation Risk at Scale with Deep Learning
satai
2
110
Open Gateway 5GC利用への期待と不安
stellarcraft
2
170
論文紹介:Not All Tokens Are What You Need for Pretraining
kosuken
1
220
高畑鬼界ヶ島と重文・称名寺本薬師如来像の来歴を追って/kikaigashima
kochizufan
0
110
Tiaccoon: Unified Access Control with Multiple Transports in Container Networks
hiroyaonoe
0
180
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
370
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.3k
EarthDial: Turning Multi-sensory Earth Observations to Interactive Dialogues
satai
3
450
Panopticon: Advancing Any-Sensor Foundation Models for Earth Observation
satai
3
450
大規模言語モデルにおけるData-Centric AIと合成データの活用 / Data-Centric AI and Synthetic Data in Large Language Models
tsurubee
1
460
Featured
See All Featured
Navigating Weather and Climate Data
rabernat
0
49
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.6k
AI: The stuff that nobody shows you
jnunemaker
PRO
1
12
A Soul's Torment
seathinner
1
2k
GitHub's CSS Performance
jonrohan
1032
470k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.3k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
400
Everyday Curiosity
cassininazir
0
110
Speed Design
sergeychernyshev
33
1.4k
The Pragmatic Product Professional
lauravandoore
37
7.1k
Transcript
論文紹介:CutMix Regularization Strategy to Train Strong Classifiers with Localizable Features
https://arxiv.org/abs/1905.04899 https://github.com/clovaai/CutMix-PyTorch
はじめに • LTだし非エンジニアの方もいるので、 ゆるめに論文を紹介します • 最近の画像向けNeural Networkの正則化・Data Augmentation 手法の雰囲気を知って貰えれば…
目次 • 従来手法 • 従来手法の問題点 • 提案手法 • 実験 間に合いませんでしたゴメンナサイ
従来手法:Cutout (Random Erasing) • 画像中のランダムな矩形領域を単色 or ノイズで埋める • Dropoutを入力に対して適用するイメージ? https://arxiv.org/abs/1708.04896
https://arxiv.org/abs/1708.04552
従来手法: MixUp • 2つのデータを混合して新たなサンプルを作成する手法 • データだけでなく、ラベルを混合する点が特徴的 • 数値データにも有効 https://arxiv.org/abs/1809.02499 dog:
1.0 cat : 0.0 dog: 0.0 cat : 1.0 dog: 0.5 cat : 0.5
従来手法の問題点① • 重要な情報が欠損する可能性がある • 例:車種分類モデルの場合 Q:トヨタ86はどっち?
従来手法の問題点② • 合成画像が不自然になり、何を学習しているのか解釈しづらい プードルとセントバー ナードを見分けるタスク Mixup、Cutoutを適用 「セントバーナード」と回答 するときどこを見ているか 「プードル」と回答するとき どこを見ているか
提案手法: CutMix • CutoutとMixupの合わせ技 • Cutoutで切り取った領域に他クラスの 画像を合成
従来手法との精度比較 • 実験が間に合わなかったので論文の 結果 • Classification, Localization, Object Detection, Image
Captioningのタス クで従来手法よりも精度が向上
まとめ • 画像データの正則化手法としてCutout、Mixup等の手法が利用 されている • これらの手法は、タスクによっては逆効果になり得る • CutMixで解決! (らしい)