Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ゆるい論文紹介:CutMix
Search
Akira TSURUDA
July 17, 2019
Research
0
280
ゆるい論文紹介:CutMix
えだまめLT会発表資料
Akira TSURUDA
July 17, 2019
Tweet
Share
More Decks by Akira TSURUDA
See All by Akira TSURUDA
Sonyの一眼をWeb APIでhackする
kiakiraki
0
180
VSCodeのススメ
kiakiraki
0
30
Other Decks in Research
See All in Research
「エージェントって何?」から「実際の開発現場で役立つ考え方やベストプラクティス」まで
mickey_kubo
0
120
Looking for Escorts in Sydney?
lunsophia
1
120
Large Language Model Agent: A Survey on Methodology, Applications and Challenges
shunk031
13
8.9k
Self-supervised audiovisual representation learning for remote sensing data
satai
3
230
近似動的計画入門
mickey_kubo
4
980
Principled AI ~深層学習時代における課題解決の方法論~
taniai
3
1.2k
(NULLCON Goa 2025)Windows Keylogger Detection: Targeting Past and Present Keylogging Techniques
asuna_jp
2
550
定性データ、どう活かす? 〜定性データのための分析基盤、はじめました〜 / How to utilize qualitative data? ~We have launched an analysis platform for qualitative data~
kaminashi
7
1.1k
カスタマーサクセスの視点からAWS Summitの展示を考える~製品開発で活用できる勘所~
masakiokuda
2
130
利用シーンを意識した推薦システム〜SpotifyとAmazonの事例から〜
kuri8ive
1
210
SSII2025 [SS1] レンズレスカメラ
ssii
PRO
2
980
2025/7/5 応用音響研究会招待講演@北海道大学
takuma_okamoto
1
110
Featured
See All Featured
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.5k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.6k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.3k
Docker and Python
trallard
45
3.5k
How to train your dragon (web standard)
notwaldorf
96
6.1k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
357
30k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
RailsConf 2023
tenderlove
30
1.1k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Transcript
論文紹介:CutMix Regularization Strategy to Train Strong Classifiers with Localizable Features
https://arxiv.org/abs/1905.04899 https://github.com/clovaai/CutMix-PyTorch
はじめに • LTだし非エンジニアの方もいるので、 ゆるめに論文を紹介します • 最近の画像向けNeural Networkの正則化・Data Augmentation 手法の雰囲気を知って貰えれば…
目次 • 従来手法 • 従来手法の問題点 • 提案手法 • 実験 間に合いませんでしたゴメンナサイ
従来手法:Cutout (Random Erasing) • 画像中のランダムな矩形領域を単色 or ノイズで埋める • Dropoutを入力に対して適用するイメージ? https://arxiv.org/abs/1708.04896
https://arxiv.org/abs/1708.04552
従来手法: MixUp • 2つのデータを混合して新たなサンプルを作成する手法 • データだけでなく、ラベルを混合する点が特徴的 • 数値データにも有効 https://arxiv.org/abs/1809.02499 dog:
1.0 cat : 0.0 dog: 0.0 cat : 1.0 dog: 0.5 cat : 0.5
従来手法の問題点① • 重要な情報が欠損する可能性がある • 例:車種分類モデルの場合 Q:トヨタ86はどっち?
従来手法の問題点② • 合成画像が不自然になり、何を学習しているのか解釈しづらい プードルとセントバー ナードを見分けるタスク Mixup、Cutoutを適用 「セントバーナード」と回答 するときどこを見ているか 「プードル」と回答するとき どこを見ているか
提案手法: CutMix • CutoutとMixupの合わせ技 • Cutoutで切り取った領域に他クラスの 画像を合成
従来手法との精度比較 • 実験が間に合わなかったので論文の 結果 • Classification, Localization, Object Detection, Image
Captioningのタス クで従来手法よりも精度が向上
まとめ • 画像データの正則化手法としてCutout、Mixup等の手法が利用 されている • これらの手法は、タスクによっては逆効果になり得る • CutMixで解決! (らしい)