Colorful image colorization

Slide 1

Slide 1 text

Colorful Image Colorization @tereka114

Slide 2

Slide 2 text

自己紹介 1. 山本大輝 2. Acroquest Technology株式会社 3. Software Engineer 4. Twitter:@tereka114 5. Blog：のんびりしているエンジニアの日記 1. 「http://nonbiri-tereka.hatenablog.com/」

Slide 3

Slide 3 text

年末といえば・・・

Slide 4

Slide 4 text

そう

Slide 5

Slide 5 text

Advent Calendarですね

Slide 6

Slide 6 text

Advent Calendar

Slide 7

Slide 7 text

今日は何の日でしょう？

Slide 8

Slide 8 text

今日は何の日でしょう？ Today!!

Slide 9

Slide 9 text

目次 1. はじめに 2. 論文概要 3. 論文の提案 4. 実験 5. 実験結果 6. まとめ

Slide 10

Slide 10 text

1Pでわかる論文概要 1. 白黒画像をDeep Learning（CNN）で彩色する論文 2. Lを入力とし、ab空間を求めて再構築。 3. Class Rebalanceを考慮した誤差関数を使う。

Slide 11

Slide 11 text

どんな論文か？

Slide 12

Slide 12 text

どんな論文か？

Slide 13

Slide 13 text

どんな論文か？

Slide 14

Slide 14 text

従来までのColorizationとの違い 1. 従来と異なるところ 1. シーケンシャルなモデル（Single Streamと表現） 1. Dilated convolutionを使った。 2. 誤差関数を改良した。 1. クラスリバランスな誤差関数を使った

Slide 15

Slide 15 text

論文の提案 1. 色推定部はクラス分類を実施した。 1. 従来手法は回帰式や通常の分類 2. レア度を考慮した式を構築 2. 頻出度合いに応じた重み付けを実施した。 1. クラスリバランスな式を構築、検証

Slide 16

Slide 16 text

ネットワーク構成 L空間 ab空間 Conv + ReLU + BatchNorm

Slide 17

Slide 17 text

問題 1. ネットワークの入力と教師は次の通り 1. 入力画像はL Channelの画像 2. 教師はab空間の画像 2. L空間の画像を与えた時にab空間はどのようになっているかを答えるネットワーク

Slide 18

Slide 18 text

CIE Lab空間 1. CIE Lab色空間は人間の視覚を近似するよう設計されている。 1. 人間の知覚に最も合う空間 2. L:明度、a,b：カラー軸引用「http://www.adobe.com/jp/support/techguides/color/colormodels/cielab.html」これを推定する。

Slide 19

Slide 19 text

誤差関数の発展 1. 連続値を使用した誤差関数 1. L2誤差関数 2. 多クラス分類を使った誤差関数 3. Class Rebalancingを利用した誤差関数（提案） 1. 2にClassRebalancing項を加えた。

Slide 20

Slide 20 text

L2 誤差関数 1. 色空間を連続値として扱い、誤差を計算した。 2. L2 誤差関数は曖昧さに対して、ロバストではない。

Slide 21

Slide 21 text

クラス分類の誤差関数 1. 多クラス分類の誤差関数を使い計算を試みた。 1. Lab空間のグリッドをサイズ10ずつで分割した。 2. 分割結果はQ=313となり、この空間を推定する。 Qの分布

Slide 22

Slide 22 text

Why class rebalance 1. 自然画像はabの値が偏る。 1. 自然画像は壁や背景、塗装が多い。 1. 一色でカラーリングされている箇所が該当しそう。 2. Pixelの出現頻度に応じて重みを付ける。 1. リバランスする為の重みをつける。

Slide 23

Slide 23 text

Class rebalancing 1. 提案手法であるClass reblancingは次式通常のクラス分類と同様クラスリバランシングこれを求める。

Slide 24

Slide 24 text

Class rebalancing 通常のクラス分類と同様クラスリバランシング L値によって分布が異なる。

Slide 25

Slide 25 text

Class rebalancing 1. 提案手法であるClass reblancingは次式通常のクラス分類と同様クラスリバランシングこれを求める。

Slide 26

Slide 26 text

Rebalancing rebalancingで使うWeight 313 0.5

Slide 27

Slide 27 text

求めるべきYを推定 1. 分布（Z）を求めたので最後はYを推定する。 2. Tの変化により、分布が変化する。 1. T=1の場合：変化なし 2. T=0に近い場合：ピークが強調される。 3. T=0の場合：1hotになる。これをどうするか

Slide 28

Slide 28 text

Tの値による推移

Slide 29

Slide 29 text

Tの値による推移大体このあたりが違う。

Slide 30

Slide 30 text

彩色成功例提案手法

Slide 31

Slide 31 text

彩色失敗例

Slide 32

Slide 32 text

実験内容 1. 実験データはImageNetを利用し、trainとvalidation はそのデータを使っている。 2. 評価手法はAMT、VGG top1、AuCのスコアを使い、評価している。

Slide 33

Slide 33 text

評価手法 1. AMT（Amazon Mechanical Turk） 1. AMTを使って生成とGround Truth画像を2枚見せ、どちらがよりリアルかを判定する。 2. VGG Top1 1. クラス分類の正答率を計算 3. AuC 1. ab空間のエラー閾値が一定以下かを計算する。

Slide 34

Slide 34 text

結果最も良い

Slide 35

Slide 35 text

GTと生成手法で並べた

Slide 36

Slide 36 text

昔からある白黒画像を入力した

Slide 37

Slide 37 text

まとめ 1. グレー画像からカラー画像へ変換するタスクを解いた。 2. クラスリバランスを行った。 3. よりリアルな彩色が可能となった。