JSAI Cup 2018に惨敗!! Random Erasing & Mixupやってみた / Try Random Erasing & Mixup

JSAI Cup2018に惨敗!! Random Erasing & Mixupやってみた 2018/8/26 Moonlight明日香大江橋Pythonの会 #2
LT

自己紹介 ➢鶴田彰 ➢外資系メーカー勤務 ➢昔は, ・パターン認識(音声, 文字, etc) ・ユーザ適応(レコメンド, etc)
なども・・・最近は, 週末プログラマとしてまた機械学習に再チャレンジ中! Facebook ：moonlight.aska Twitter ：@moonlight_aska Blog ：みらいテックラボ http://mirai-tec.hatenablog.com

JSAI Cup 2018とは? テーマ：画像認識クックパッド様の提供する画像データを使用して, 食材の分類の画像認識アルゴリズムの作成に挑戦データと評価関数 55種類の食材カテゴリの1つに分類 [学習データ]
[テストデータ] ・11,995枚・3,995枚 [評価関数] Accuracy = :集合Aの要素数 :サンプル数 :i番目の真値 ෝ :i番目の予測値 ( = ෡ = 1,2,… , )

データの確認(1) 55カテゴリ分類果菜類トマトカボチャキューリナスピーマン・・・
葉菜類ハクサイキャベツコマツナミズナレタス・・・茎菜類アスパラネギタマネギニンニク根菜類ダイコンゴボウニンジンレンコンショウガイモ類ジャガイモサトイモサツマイモナガイモ：菌茸類エノキエリンギマイタケマッシュルームシイタケシメジ果物アボカドバナナクリリンゴレモンその他エビタコタマゴ

データの確認(2) データの一例注) クックパッド様に画像の使用許諾取得済

JSAI Cupでやったこと実装制限 ◆ API(Google Cloud Vision等)の利用は禁止. ◆ ImageNetなどによる学習済モデルの利用は禁止.
◆ 2つ以上の異なるモデルを用いてアンサンブル学習させるのは禁止. 画像認識で性能upする方法 ◆ 前処理(高解像度, 正規化, ほか) ◆ Data Augmentation ◆ 転移学習(Fine Tuning) ◆ Ensemble学習(複数モデル, 複数入力) ◆ モデル構造の改良 ◆ ハイパーパラメータの調整： ◼ 公知モデルの使用 ◼ データオーギュメンテーション ◼ 複数入力によるアンサンブル (Test Time Augmentation)

コンテストの結果・・・応募(3/16) 9位(95.0%) 締切(3/29) 14位 ↓ 最終
19位(93.2%) 惨敗!! Top 98.3%

記事をもとに振り返り http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00323/061600003/?P=1

入賞者の手法(1) Data Augmentation 1. Random Erasing Data Augmentation (2017/8) 2.
mixup : Beyond Empirical Risk Minimization (2017/10) 0.7 * dog + 0.3 * cat

入賞者の手法(2) 2018年度人工知能学会データ解析コンペティション発表資料より半教師あり学習 1. Mean teachers are better role models
(2017/3) 生徒, 教師は互いに別々のノイズが付与されたデータをもとに予測を行い, 生徒はラベルと教師の予測との一致をもとに学習を行い, 教師は, エポック終了後に生徒の学習結果をマージするらしい.

入賞者の手法(3) 半教師あり学習 2. Pseudo-labelling 2018年度人工知能学会データ解析コンペティション発表資料より

Random Erasing Data Augmentation やってみた!!

Random Erasing Data Augmentationとは? 画像の一部を矩形領域でマスクしても, 犬とわかる!! 過学習を防ぐのに効果あり!!

アルゴリズム https://arxiv.org/abs/1708.04896 p : Random Erasingを使用する確率 Sl, Sh : マスク領域の最小/最大比率
r1, r2 : マスク領域のアスペクト比の最大/最小値

画像生成結果入力画像生成画像

Mixupもやってみた!!

Mixupとは? X = λX1 + (1 – λ)X2 y =
λy1 + (1 – λ)y2 2つの訓練サンプルのペア(X1 , y1 ), (X2 , y2 )を混合して新たな訓練サンプルを作成但し, λ∈[0, 1]はベータ分布Be(α, α)からのサンプリングラベルy1 , y2 も混合するところが特徴的 0.7 * dog + 0.3 * cat

ベータ分布

画像生成結果 α = 0.5

効果は？金魚分類タスク(22種類の分類)でやってみたが… ⇒ ほとんど効果みられず. 考えられること: 学習/評価データが少ない為か!? 学習データ：880 (約40サンプル/種類) 評価データ： 87
(約4サンプル/種類)

最後に, 金魚分類タスクとは？金魚AI(愛)育成プロジェクト・金魚の見分け難しい・体調わかるようになりたい http://mirai-tec.hatenablog.com/entry/2018/07/30/235036 ▪金魚データの収集 ▪金魚22種類の分類

Thank You!

JSAI Cup 2018に惨敗!! Random Erasing & Mixupやってみた ...

JSAI Cup 2018に惨敗!! Random Erasing & Mixupやってみた / Try Random Erasing & Mixup

moonlight-aska

More Decks by moonlight-aska

Featured

Transcript

JSAI Cup2018に惨敗!! Random Erasing & Mixupやってみた 2018/8/26 Moonlight明日香大江橋Pythonの会 #2

自己紹介 ➢鶴田彰 ➢外資系メーカー勤務 ➢昔は, ・パターン認識(音声, 文字, etc) ・ユーザ適応(レコメンド, etc)

JSAI Cup 2018とは? テーマ：画像認識クックパッド様の提供する画像データを使用して, 食材の分類の画像認識アルゴリズムの作成に挑戦データと評価関数 55種類の食材カテゴリの1つに分類 [学習データ]

データの確認(1) 55カテゴリ分類果菜類トマトカボチャキューリナスピーマン・・・

データの確認(2) データの一例注) クックパッド様に画像の使用許諾取得済

JSAI Cupでやったこと実装制限 ◆ API(Google Cloud Vision等)の利用は禁止. ◆ ImageNetなどによる学習済モデルの利用は禁止.

コンテストの結果・・・応募(3/16) 9位(95.0%) 締切(3/29) 14位 ↓ 最終

記事をもとに振り返り http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00323/061600003/?P=1

入賞者の手法(1) Data Augmentation 1. Random Erasing Data Augmentation (2017/8) 2.

入賞者の手法(2) 2018年度人工知能学会データ解析コンペティション発表資料より半教師あり学習 1. Mean teachers are better role models