Exploration of Generative Models 単一画像超解像の主な目的は、対応する低解像度(LR)入力から高解像度(HR)画像を構築することである。こ れまでのアプローチでは、一般的に教師ありきで行われてきたが、トレーニングの目的は、通常、超解像(SR) 画像とHR画像の間のピクセル単位の平均距離を測定することであった。このようなメトリクスを最適化すると、 特に高分散(詳細)領域ではぼやけてしまうことが多い。本研究では、正確にダウンスケールする現実的なSR 画像を作成することに基づいて、超解像問題の代替的な定式化を提案する。この問題を解決する新しい超解 像アルゴリズム、PULSE (Photo Upsampling via Latent Space Exploration)を提案します。これは、これまでの手 法(教師付き学習のためにLR-HR画像ペアのデータベースを用いて学習する必要があった)とは異なり、学習 時に使用する特定の劣化演算子に制限されることなく、完全に自己監視下で行われます。PULSEは、LR画像 から始めてゆっくりと詳細を追加するのではなく、高解像度の自然画像の多様性を探索し、元のLR画像にダ ウンスケールする画像を探します。これは「ダウンスケーリングロス」によって形式化され、生成モデルの潜在 空間を探索する際の指針となります。高次元ガウシアンの特性を利用して、検索空間を制限し、現実的な出 力を保証します。これにより、PULSEは現実的でありながらダウンスケールを正確に行うことができる超解像画 像を生成します。私たちのアプローチが顔の超解像(顔の幻覚としても知られています)の領域で有効である ことを示す広範な実験結果を示しています。私たちの手法は、これまで可能だったよりも高い解像度とスケー ルファクタにおいて、知覚品質において最先端の手法を凌駕しています。 Top Hype 4 超解像度画像生成