Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
resize_nitpick
Search
yoya
November 15, 2019
Technology
1
130
resize_nitpick
画像リサイズの重箱の隅を突く話 (前半)
yoya
November 15, 2019
Tweet
Share
More Decks by yoya
See All by yoya
ImageFluxBinary
yoya
2
2.4k
HEIF-kaisetsu
yoya
4
3k
go-thumber-imagick
yoya
1
150
chokaizomae
yoya
2
480
wildimagebinary
yoya
1
190
goimagicksyokai
yoya
2
990
GoImagickThumbnail
yoya
0
1.3k
sushigazou
yoya
0
11k
twitterimgupload
yoya
0
330
Other Decks in Technology
See All in Technology
EM完全に理解した と思ったけど、 やっぱり何も分からなかった話 / EM Night Fukuoka #1
hirutas
0
300
[新卒向け研修資料] テスト文字列に「うんこ」と入れるな(2024年版)
infiniteloop_inc
5
18k
M5stackで使用できるpHセンサの開発
shinrinakamura
0
230
KubeConにproposalを送りたい人へのアドバイス
sat
PRO
3
270
Gitlab本から学んだこと - そーだいなるプレイバック / gitlab-book
soudai
7
1.4k
今年のRubyKaigiはProfiler Year🤘
osyoyu
0
470
Next.js に疲れた私は Vue3 に癒やされた
akagire
0
140
Max out Local LLM in Challenging Environments
sashimimochi
2
190
地理空間データ可視化・解析・活用ソリューション Pacific Spatial Solutions (PSS)
pacificspatialsolutions
0
350
データベース03: 関係データモデル
trycycle
0
100
【基本】データベース設計
oracle4engineer
PRO
2
230
生成AIの変革の時代に、直近1年で直面した課題とその解決策
ktc_wada
1
740
Featured
See All Featured
What's new in Ruby 2.0
geeforr
337
31k
Into the Great Unknown - MozCon
thekraken
15
1k
What's in a price? How to price your products and services
michaelherold
238
11k
Fontdeck: Realign not Redesign
paulrobertlloyd
76
4.9k
Gamification - CAS2011
davidbonilla
77
4.6k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
20
1.8k
Agile that works and the tools we love
rasmusluckow
325
20k
It's Worth the Effort
3n
180
27k
Docker and Python
trallard
35
2.7k
Bash Introduction
62gerente
605
210k
Making Projects Easy
brettharned
109
5.5k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
660
120k
Transcript
画像リサイズの重箱の 隅を突く話 (前半) 2019/11/15(⾦) “よや” <
[email protected]
>
⾃⼰紹介 • twitter.com/yoya • github.com/yoya • ImageMagick ウォッチャー(⾃称) • 画像リサイズのうんちく
(今回のネタ下) • https://qiita.com/yoya/items/95c37e02762431b1abf0
発表のきっかけ https://twitter.com/yoya/status/1192667961934278656
サムネール⽣成のうんちく(仮)から抜粋 • 画像リサイズ処理 • ⾊々 • アスペクト⽐ • メタデータ •
画像の回転 (orientation) • サムネール 画像 • GPS位置情報 • 撮影情報(カメラ型番や設定など • ⾊空間 ࠓίϨ
画像リサイズの処理⽅式 • 補間フィルタ • フィルタの種類 • セパラブルの順序 • フィルタのカーネル粒度 •
オフセット (コーナー合わせ) • エッジ処理 • 次回予定 • ビット深度 • ガンマ補正 • USM (unsharp mask) • パレット⾊保持 ࠓ͜͜·Ͱ
知る事のメリット • 任意の画像処理エンジンと厳密に⼀致させる処理が⾃作できる (かもしれない) • ⾃分の⽤途にあった改造ができる • 画像サービスの使ってる画像エンジンを推測できる • バージョンまである程度絞れる(かもしれない)
補間フィルタ • リサイズ結果が違う場合、⼤抵これが原因 • 拡⼤してできる隙間をどう埋めるか => 補間フィルタ ϐΫηϧΛ͛Δ 伱ؒΛຒΊΔ
補間フィルタ • 縮⼩の場合、どのように混ぜるか ϐΫηϧΛߥ͘͢Δ ࠞͥΔ
補間フィルタの種類 • よく使われるのは以下の4つ • NearestNeighbor • Bi-Linear • Bi-Cubic •
Catmul-Rom (B:0, C:1/2) • Mitchell (B:1/3, C:1/3) • Lanczos (Lobe:3,4) この辺は常識なので説明省略! https://en.wikipedia.org/wiki/Bicubic_interpolation
補間フィルタ (セパラブル) • 2次元のフィルタを縦と横で分けて処理できる
補間フィルタ (セパラブル) • 良いといっても、計算機誤差からの差異は⽣じる • 左が実験画像、真ん中は横=>縦の順。右は縦=>横の順、差分強調
補間フィルタ (セパラブル) • 横を先に処理して、次に縦 (Python-Pillow) • メモリは横の⽅が局所的アクセスできる • より縮⼩率の⾼い⽅を先に処理する (ImageMagick
5以降) • なるべく途中の画像が⼩さくなるように • 縦が広がる場合は横を先に処理する (ImageMagick 4以前) • アスペクト⽐で判断
補間フィルタ (カーネル粒度) • 補間フィルタのカーネル計算が重たいケースがある -BODPT ͳΜͯ ΊͬͪΌॏ͍ͨ ⼀度、計算した結果を LUT(lookup table)
に保存して、 これを元に畳み込み計算する
補間フィルタ (カーネル粒度) • ImageMagick では 0.01 刻みの LUT を持つ •
OpenCV はリサイズ後の画像サイズの LUT • FFmpeg swscale は dstW/srcW (+α) の LUT
補間フィルタ (オフセット) • ピクセルの広げ⽅にも種類がある ࠨ্߹Θͤ ਅΜத߹Θͤ ࢛۱߹Θͤ DPSOFS@BMJHOFE PGGTFU OBJWF
͍͍ͩͨίϨ
補間フィルタ (オフセット) • Pillow(PIL) の動きがバージョンで異なる • https://qiita.com/yoya/items/3b4a8080516259ece684 1JMMPXҎલ ݄ 1JMMPXҎ߱
݄
補間フィルタ (オフセット) • Pillow-3.3.3以前 Pillow-3.4.0以降
補間フィルタ (エッジの畳み込み) • Bi-Linearを含む⼤抵のフィルタは混ぜる範囲が画像の外を巻き 込む ࠞͥΔ
補間フィルタ (エッジの畳み込み) • ImageMagick, PIL(Pillow) • 画像の外を無視する • 画像の中だけで畳み込む •
畳み込みが中途半端 ը૾ ͷ֎ 255 0 0 x0.75 x0.75 *0.25 191/(0.75+0.75+0.25) =191 =0 =0 = 109 *0.25
補間フィルタ (エッジの畳み込み) • OpenCV • エッジの⾊が外に続く仮定 255 0 0 x0.75
x0.75 *0.25 =191 =0 =0 = 127 255 *0.25 =63 ը૾ ͷ֎ ͖ͬ͞ͷ ΑΓ ໌Δ͍ (63+191)/(0.25+0.75+0.75+0.25)
補間フィルタ (エッジの畳み込み) • 本来、画像の外側の仮定によってリサイズ結果を変えるべき &EHF3FQFBUFE 3FGMFDU NJSSPS 5JMJOH
まとめ • リサイズの実装アルゴリズムは選択肢が多くある • これらの組み合わせから、サムネール画像を⾒て処理に使った 画像エンジンを推測する事ができる。(かもしれない)
次回予告 • 次回予定 • ビット深度 • ガンマ補正 • USM (unsharp
mask) • パレット⾊保持