Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Colorful image colorization
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
tereka114
March 16, 2022
Programming
280
0
Share
Colorful image colorization
tereka114
March 16, 2022
More Decks by tereka114
See All by tereka114
トラブルがあったコンペに学ぶデータ分析
tereka114
2
1.9k
Harnessing Large Language Models for Training-free Video Anomaly Detection
tereka114
1
1.7k
KDD2023学会参加報告
tereka114
2
660
Prompting Large Language Models with Answer Heuristics for Knowledge-based Visual Question Answering
tereka114
0
440
Mobile-Former: Bridging MobileNet and Transformer
tereka114
0
1.2k
DER: Dynamically Expandable Representation for Class Incremental Learning
tereka114
0
250
Jupyter Notebookを納品した話
tereka114
0
530
Multi Scale Recognition with DAG-CNNs
tereka114
0
170
How to use scikit-image for data augmentation
tereka114
0
310
Other Decks in Programming
See All in Programming
Coding at the Speed of Thought: The New Era of Symfony Docker
dunglas
0
4.6k
PHPで TLSのプロトコルを実装してみる
higaki_program
0
740
今こそ押さえておきたい アマゾンウェブサービス(AWS)の データベースの基礎 おもクラ #6版
satoshi256kbyte
1
230
PHPで TLSのプロトコルを実装してみるをもう一度しゃべりたい
higaki_program
0
180
今年もTECHSCOREブログを書き続けます!
hiraoku101
0
220
The free-lunch guide to idea circularity
hollycummins
0
420
The Monolith Strikes Back: Why AI Agents ❤️ Rails Monoliths
serradura
0
220
PHP でエミュレータを自作して Ubuntu を動かそう
m3m0r7
PRO
2
170
煩雑なSkills管理をSoC(関心の分離)により解決する――関心を分離し、プロンプトを部品として育てるためのOSSを作った話 / Solving Complex Skills Management Through SoC (Separation of Concerns)
nrslib
3
520
メッセージングを利用して時間的結合を分離しよう #phperkaigi
kajitack
3
560
PDI: Como Alavancar Sua Carreira e Seu Negócio
marcelgsantos
0
100
Mastering Event Sourcing: Your Parents Holidayed in Yugoslavia
super_marek
0
150
Featured
See All Featured
Embracing the Ebb and Flow
colly
88
5k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Making the Leap to Tech Lead
cromwellryan
135
9.8k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
310
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.4k
Deep Space Network (abreviated)
tonyrice
0
110
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
200
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
260
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.4k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
330
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9k
Transcript
Colorful Image Colorization @tereka114
自己紹介 1. 山本 大輝 2. Acroquest Technology株式会社 3. Software Engineer
4. Twitter:@tereka114 5. Blog:のんびりしているエンジニアの日記 1. 「http://nonbiri-tereka.hatenablog.com/」
年末といえば・・・
そう
Advent Calendarですね
Advent Calendar
今日は何の日でしょう?
今日は何の日でしょう? Today!!
目次 1. はじめに 2. 論文概要 3. 論文の提案 4. 実験 5.
実験結果 6. まとめ
1Pでわかる論文概要 1. 白黒画像をDeep Learning(CNN)で彩色する論文 2. Lを入力とし、ab空間を求めて再構築。 3. Class Rebalanceを考慮した誤差関数を使う。
どんな論文か?
どんな論文か?
どんな論文か?
従来までのColorizationとの違い 1. 従来と異なるところ 1. シーケンシャルなモデル(Single Streamと表現) 1. Dilated convolutionを使った。 2.
誤差関数を改良した。 1. クラスリバランスな誤差関数を使った
論文の提案 1. 色推定部はクラス分類を実施した。 1. 従来手法は回帰式や通常の分類 2. レア度を考慮した式を構築 2. 頻出度合いに応じた重み付けを実施した。 1.
クラスリバランスな式を構築、検証
ネットワーク構成 L空間 ab空間 Conv + ReLU + BatchNorm
問題 1. ネットワークの入力と教師は次の通り 1. 入力画像はL Channelの画像 2. 教師はab空間の画像 2. L空間の画像を与えた時にab空間はどのようになっ
ているかを答えるネットワーク
CIE Lab空間 1. CIE Lab色空間は人間の視覚を近似するよう設計さ れている。 1. 人間の知覚に最も合う空間 2. L:明度、a,b:カラー軸
引用「http://www.adobe.com/jp/support/techguides/color/colormodels/cielab.html」 これを推定する。
誤差関数の発展 1. 連続値を使用した誤差関数 1. L2誤差関数 2. 多クラス分類を使った誤差関数 3. Class Rebalancingを利用した誤差関数(提案)
1. 2にClassRebalancing項を加えた。
L2 誤差関数 1. 色空間を連続値として扱い、誤差を計算した。 2. L2 誤差関数は曖昧さに 対して、ロバストではない。
クラス分類の誤差関数 1. 多クラス分類の誤差関数を使い計算を試みた。 1. Lab空間のグリッドをサイズ10ずつで分割した。 2. 分割結果はQ=313となり、この空間を推定する。 Qの分布
Why class rebalance 1. 自然画像はabの値が偏る。 1. 自然画像は壁や背景、塗装が多い。 1. 一色でカラーリングされている箇所が該当しそう。 2.
Pixelの出現頻度に応じて重みを付ける。 1. リバランスする為の重みをつける。
Class rebalancing 1. 提案手法であるClass reblancingは次式 通常のクラス分類と同様 クラスリバランシング これを求める。
Class rebalancing 通常のクラス分類と同様 クラスリバランシング L値によって分布が異なる。
Class rebalancing 1. 提案手法であるClass reblancingは次式 通常のクラス分類と同様 クラスリバランシング これを求める。
Rebalancing rebalancingで使うWeight 313 0.5
求めるべきYを推定 1. 分布(Z)を求めたので最後はYを推定する。 2. Tの変化により、分布が変化する。 1. T=1の場合:変化なし 2. T=0に近い場合:ピークが強調される。 3.
T=0の場合:1hotになる。 これをどうするか
Tの値による推移
Tの値による推移 大体このあたりが 違う。
彩色成功例 提案手法
彩色失敗例
実験内容 1. 実験データはImageNetを利用し、trainとvalidation はそのデータを使っている。 2. 評価手法はAMT、VGG top1、AuCのスコアを使い、 評価している。
評価手法 1. AMT(Amazon Mechanical Turk) 1. AMTを使って生成とGround Truth画像を2枚見せ、どちら がよりリアルかを判定する。 2.
VGG Top1 1. クラス分類の正答率を計算 3. AuC 1. ab空間のエラー閾値が一定以下かを計算する。
結果 最も良い
GTと生成手法で並べた
昔からある白黒画像を入力した
まとめ 1. グレー画像からカラー画像へ変換するタスクを解 いた。 2. クラスリバランスを行った。 3. よりリアルな彩色が可能となった。