Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SSII2025 [OS3-02] 広告における画像生成技術の実応用の現状
Search
画像センシングシンポジウム
PRO
May 30, 2025
5
1.2k
SSII2025 [OS3-02] 広告における画像生成技術の実応用の現状
画像センシングシンポジウム
PRO
May 30, 2025
Tweet
Share
More Decks by 画像センシングシンポジウム
See All by 画像センシングシンポジウム
SSII2025 [OS3] どの論文でもダメなんだけど! 〜実応用とその課題〜
ssii
PRO
2
980
SSII2025 [OS3-01] End-to-End自動運転の実応用の現場から
ssii
PRO
6
2k
SSII2025 [OS3-03] 有機ミニトマト農場におけるロボット開発と基礎研究
ssii
PRO
0
890
SSII2025 [OS2-01] 自動運転の性能と共に進化するセンシングデバイス
ssii
PRO
2
1.7k
SSII2025 [TS3] 医工連携における画像情報学研究
ssii
PRO
2
1.1k
SSII2025 [OS2] 新たなセンシングの潮流
ssii
PRO
1
510
SSII2025 [OS2-02] イベントカメラの研究紹介と可視光通信への応用
ssii
PRO
1
790
SSII2025 [OS2-03] マルチ/ハイパースペクトル領域における高度な画像撮影および処理技術
ssii
PRO
2
740
SSII2025 [SS1] レンズレスカメラ
ssii
PRO
2
900
Featured
See All Featured
Designing for Performance
lara
609
69k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.8k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
281
13k
Being A Developer After 40
akosma
90
590k
BBQ
matthewcrist
89
9.7k
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
The Language of Interfaces
destraynor
158
25k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.4k
Transcript
広告における画像生成技術 の実応用の現状 下田 和(サイバーエージェント)
2 サイバーエージェント, AI Lab - 広告画像のテキストに関連する研究 - 画像生成技術の広告画像への応用 下田 和(Shimoda
Wataru)
3 画像生成技術の躍進 DCGAN [Radford+, ICLR 2016] DALL·E 2, [Ramesh+, arXiv
2022] A photorealistic image of an astronaut riding a horse An infographic explaining newton's prism experiment in great detail GPT-4o Image generation [OpenAI, Blog 2025]
4 画像生成タスクの性能は飛躍的に向上 - GPT-4o image generationの評価論文 - Reason-Edit benchmark -
画像編集タスク - by GPT image generation - 56.1% → 92.9% - WISE benchmark - 複雑な概念を理解した画像生成 - by GPT image generation - 50.0% → 80.0% 画像生成技術の躍進 GPT-ImgEval [Yan+, arXiv 2025]
5 実応用における課題 添付したロゴを使って以下の文言を含んだ横長のバナーを作って "SSII 2025" "The 31st Symposium on Sensing
via Image Information" "第31回画像センシングシンポジウム" "日程:025年5月28日 (水) 〜 2025年5月30日 (金)" "会場:東京ビッグサイト レセプションホールA・B"
6 実応用における課題 フォントが味気ない 見切れている文字がある (金)の文字サイズがおかしい 余白が狭すぎる 元のロゴから微妙に変わ っている 漢字が部分的に崩壊
7 ChatGPTのUI上での繰り返しのやり取りでの改善(約10回の生成) 実応用における課題
8 実応用における課題 デザイナー GPT4o image generation
9 多くの場合実応用においては100%に近い精度が求められる - hogehogeな時に失敗します→ 実応用になかなか繋がらない 実応用における課題 添付したロゴを使って以下の文言を含んだ横長のバナーを作って "SSII 2025" "The
31st Symposium on Sensing via Image Information" "第31回画像センシングシンポジウム" "日程:025年5月28日 (水) 〜 2025年5月30日 (金)" "会場:東京ビッグサイト レセプションホールA・B"
10 画像生成技術は大きく躍進したが, 研究と実応用のギャップは依然として大きく 必要とされる品質に達しない場合が多数 画像生成技術の実応用における現状
11 できることから - ピクセル単位のエラーは多少許される傾向 サイバーエージェントにおける画像生成技術の実応用例 https://www.cyberagent.co.jp/news/detail/id=29572 https://www.cyberagent.co.jp/news/detail/id=27041 商品画像の組み合わせを大量に自動生成 画像内の文字を自動除去
12 ギャップを埋めていくために 画像生成技術の実応用に向けて
13 画像生成結果にTypoが含まれてしまったら... 画像生成技術の実応用に向けてどういった研究が行われているのか
14 画像生成技術の実応用に向けてどういった研究が行われているのか [ 下 田 + CVPR 2025 (Highlight)] [下田+
CVPR 2025 (Highlight)] 生成画像のTypoを自動で修正 - Type-R: Automatically Retouching Typos for Text-to-Image Generation
15 画像生成技術の実応用に向けてどういった研究が行われているのか 画像を直接編集し修正を行うパイプラインの提案 - OCR x Optimal transport → Text
erasing x layout生成 → Text 編集モデル x OCR [ 下 田 + CVPR 2025 (Highlight)] [下田+ CVPR 2025 (Highlight)]
16 文字崩れが起きてしまった場合... 画像生成技術の実応用に向けてどういった研究が行われているのか
17 画像生成技術の実応用に向けてどういった研究が行われているのか 生成画像のテキストをベ クターFormatに分解 Differentiable renderingによる最適化 [ 下 田 +
ICCV 2021] [下田+ ICCV 2021]
18 画像生成技術の実応用に向けてどういった研究が行われているのか Rendering engineで再描画可能 [ 下 田 + ICCV 2021]
[下田+ ICCV 2021]
19 ワークフローが実際のグラフィックデザインと違いすぎて既存のワークフローに組み込めない... 画像生成技術の実応用に向けてどういった研究が行われているのか プロンプト デザイン要件 - 商材の画像 - アスペクト比 -
テキストのサイズ制限 - フォントの指定 - ブランディング Raster Vector
20 画像生成技術の実応用に向けてどういった研究が行われているのか デザインの要件 → 背景画像生成 x 前景画像生成 x Vectorテキスト生成 実際のワークフローに近いデザイン画像の生成スキーム
COLE, 2023
21 画像生成技術の実応用に向けてどういった研究が行われているのか COLE, MSRA, arxiv’2023 OpenCOLE, CyberAgent, CVPRws 2024
22 地道な課題解決の繰り返し - 精度, 操作性, 実行速度が障壁になってい ることが多い - スピード感は大事 基盤モデルの影響
- 目覚ましい進展速度 - 基盤モデルで解決しない部分の取り組みに 焦点を当てることも重要な研究の要素にな っていく 画像生成技術の実応用に向けて 今後の展望
23 画像生成技術の実応用の話をあまり聞かない - 研究と実応用のギャップは依然として大きい 実応用に向けて現在どのような研究が行われているのか紹介 - Typo retouching - Text
vectorization - Vector image generation 今後の展望 - 地道な課題解決が実応用に繋がっていくはず - 基盤モデルの影響力は大きい まとめ