Slide 1

Slide 1 text

東京工業大学 大学院情報理工学研究科 計算工学専攻 秋山研究室 鈴木 翔吾 Convolutional Neural Networkと RankNetを用いた画像の順序予測 TokyoTech LT 2016/10/19

Slide 2

Slide 2 text

お前誰よ? 2 鈴木翔吾 / Shogo D. Suzuki @sz_dr • 東京工業大学 大学院情報理工学研究科 計算工学専攻 秋山研究室 • ケモインフォマティクス・機械学習 • メインはPython,たまにC++

Slide 3

Slide 3 text

今日のお話 3 ♥ 研究でやってること A B C A ≻ B ≻ C A ≻ C ≻ B 化合物 タンパク質 機械学習で順序を予測

Slide 4

Slide 4 text

今日のお話 4 ♥ 研究でやってること A B C A ≻ B ≻ C A ≻ C ≻ B 化合物 タンパク質 機械学習で順序を予測 今日お話すること A B C 画像 ♥ @sz_dr A ≻ B ≻ C A ≻ C ≻ B 機械学習で順序を予測

Slide 5

Slide 5 text

アイデア 5 好み関数 0.9 画像 スコア これが求まると嬉しい 0.5 0.6 0.9 ≺ ≺ スコアでソートした結果

Slide 6

Slide 6 text

好み関数のモデル化 6 好み関数 0.9 画像 スコア (RGB, W, H) = (3, 80, 80) Convolutional Neural Network : ℝ1×2×3 → ℝ 画像認識の分野で広く用いられているモデル [LeCun+ 98] ※話すと長くなる部分なので, 知らない方は各自調べてみてください

Slide 7

Slide 7 text

好み関数の最適化 7 好み関数 : ℝ1×2×3 → ℝ @sz_drの好みを反映するように 好み関数のパラメータを学習する 訓練データ : 9 : 8 ⋮ : 1 損失関数 を最小化するように学習 (Rank Net) ※ と を近づけていくイメージ 好み関数がAをBよりも高く ランク付けする確率 好み関数による画像A, Bの予測スコア Aの方が好きなとき1 Bの方が好きなとき0 同じくらい好きなとき0.5 [Burges+ 05]

Slide 8

Slide 8 text

学習の流れ 8 Lantisちゃんねるから『TVアニメ「ラブライブ!」先行発表PV』を取得 OpenCVを用いて 顔部分をクリッピング (277枚の顔画像を生成) 各画像にスコアを割り当て(つらい) 9 8 7 6 5 4 3 2 1 Chainer(Deep Learningフレームワーク)を用いて学習

Slide 9

Slide 9 text

訓練データの予測結果 9 好み関数を正しく学習できているか確認 9 8 7 6 5 4 3 2 1

Slide 10

Slide 10 text

訓練データの予測結果 10 好み関数を正しく学習できているか確認 9 8 7 6 5 4 3 2 1

Slide 11

Slide 11 text

テストデータの予測 11 訓練データ : 9 : 8 ⋮ : 1 テストデータ 『ラブライブ!』 『ラブライブ!サンシャイン!!』 ※訓練データにテストデータの画像は含まれていないことに注意

Slide 12

Slide 12 text

テストデータの予測 12 @sz_drによる好み順序 訓練 データ テスト データ

Slide 13

Slide 13 text

テストデータの予測 13 @sz_drによる好み順序 CNN+RankNetによる予測結果 訓練 データ テスト データ

Slide 14

Slide 14 text

テストデータの予測 14 CNN+RankNetによる予測結果 ☺ 似ている画像は同じような順位にきている ☹ 予測結果は正しい好み順序をあまり反映していない (訓練データとテストデータで順序傾向が異なるため?)

Slide 15

Slide 15 text

まとめ 15 やったこと Convolutional Neural NetworkとRankNetを用いた画像の順序予測 応用先は? 漫画の表紙買いとか…広告画像の最適化とか…?? できてないこと • 訓練データを集めるのが大変 (人手による評価が必要) • 評価値のバラエティの考慮 (9段階も必要…?Excellent・Good・Badくらいで良い??) • CNNでは見た目しか考慮できない (キャラクターの性格等をどうやって考慮する…??)