Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ゆるい論文紹介:CutMix
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Akira TSURUDA
July 17, 2019
Research
0
310
ゆるい論文紹介:CutMix
えだまめLT会発表資料
Akira TSURUDA
July 17, 2019
Tweet
Share
More Decks by Akira TSURUDA
See All by Akira TSURUDA
Sonyの一眼をWeb APIでhackする
kiakiraki
0
200
VSCodeのススメ
kiakiraki
0
32
Other Decks in Research
See All in Research
ForestCast: Forecasting Deforestation Risk at Scale with Deep Learning
satai
3
400
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
160
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
710
存立危機事態の再検討
jimboken
0
240
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
mssmkmr
0
270
その推薦システムの評価指標、ユーザーの感覚とズレてるかも
kuri8ive
1
320
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
160
教師あり学習と強化学習で作る 最強の数学特化LLM
analokmaus
2
890
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
340
Community Driveプロジェクト(CDPJ)の中間報告
smartfukushilab1
0
170
Proposal of an Information Delivery Method for Electronic Paper Signage Using Human Mobility as the Communication Medium / ICCE-Asia 2025
yumulab
0
170
Featured
See All Featured
Measuring & Analyzing Core Web Vitals
bluesmoon
9
760
How to Ace a Technical Interview
jacobian
281
24k
The Cost Of JavaScript in 2023
addyosmani
55
9.5k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.2k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
117
110k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
120
Design in an AI World
tapps
0
150
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
190
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
86
4 Signs Your Business is Dying
shpigford
187
22k
Embracing the Ebb and Flow
colly
88
5k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
340
Transcript
論文紹介:CutMix Regularization Strategy to Train Strong Classifiers with Localizable Features
https://arxiv.org/abs/1905.04899 https://github.com/clovaai/CutMix-PyTorch
はじめに • LTだし非エンジニアの方もいるので、 ゆるめに論文を紹介します • 最近の画像向けNeural Networkの正則化・Data Augmentation 手法の雰囲気を知って貰えれば…
目次 • 従来手法 • 従来手法の問題点 • 提案手法 • 実験 間に合いませんでしたゴメンナサイ
従来手法:Cutout (Random Erasing) • 画像中のランダムな矩形領域を単色 or ノイズで埋める • Dropoutを入力に対して適用するイメージ? https://arxiv.org/abs/1708.04896
https://arxiv.org/abs/1708.04552
従来手法: MixUp • 2つのデータを混合して新たなサンプルを作成する手法 • データだけでなく、ラベルを混合する点が特徴的 • 数値データにも有効 https://arxiv.org/abs/1809.02499 dog:
1.0 cat : 0.0 dog: 0.0 cat : 1.0 dog: 0.5 cat : 0.5
従来手法の問題点① • 重要な情報が欠損する可能性がある • 例:車種分類モデルの場合 Q:トヨタ86はどっち?
従来手法の問題点② • 合成画像が不自然になり、何を学習しているのか解釈しづらい プードルとセントバー ナードを見分けるタスク Mixup、Cutoutを適用 「セントバーナード」と回答 するときどこを見ているか 「プードル」と回答するとき どこを見ているか
提案手法: CutMix • CutoutとMixupの合わせ技 • Cutoutで切り取った領域に他クラスの 画像を合成
従来手法との精度比較 • 実験が間に合わなかったので論文の 結果 • Classification, Localization, Object Detection, Image
Captioningのタス クで従来手法よりも精度が向上
まとめ • 画像データの正則化手法としてCutout、Mixup等の手法が利用 されている • これらの手法は、タスクによっては逆効果になり得る • CutMixで解決! (らしい)