Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
Search
画像センシングシンポジウム
PRO
June 12, 2024
Research
3
2.5k
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
画像センシングシンポジウム
PRO
June 12, 2024
Tweet
Share
More Decks by 画像センシングシンポジウム
See All by 画像センシングシンポジウム
SSII2024 [OS1] 自動運転における 重要技術とトレンド紹介
ssii
PRO
0
1k
SSII2024 [PD] SSIIアナザーストーリーズ
ssii
PRO
0
270
SSII2024 [OS1] 現場の課題を解決する ロボットラーニング
ssii
PRO
0
800
SSII2024 [OS1] 画像認識におけるモデル・データの共進化
ssii
PRO
0
790
SSII2024 [OS1] 研究紹介100連発(オープンニング)
ssii
PRO
0
640
SSII2024 [OS2] 大規模言語モデルと基盤モデルの射程
ssii
PRO
0
660
SSII2024 [OS2] 画像、その先へ 〜モーション解析への誘い〜
ssii
PRO
1
1.4k
SSII2024 [OS2] 大規模言語モデルとVision & Languageのこれから
ssii
PRO
5
1.6k
SSII2024 [OS2] GPT-4Vで画像認識は終わるのか(オープニング)
ssii
PRO
0
960
Other Decks in Research
See All in Research
CSP: Self-Supervised Contrastive Spatial Pre-Training for Geospatial-Visual Representations
satai
3
120
Self-supervised audiovisual representation learning for remote sensing data
satai
3
120
ラムダ計算の拡張に基づく 音楽プログラミング言語mimium とそのVMの実装
tomoyanonymous
0
440
20250226 NLP colloquium: "SoftMatcha: 10億単語規模コーパス検索のための柔らかくも高速なパターンマッチャー"
de9uch1
0
330
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)
reisato12345
0
420
Weekly AI Agents News!
masatoto
33
62k
地理空間情報と自然言語処理:「地球の歩き方旅行記データセット」の高付加価値化を通じて
hiroki13
1
230
GeoCLIP: Clip-Inspired Alignment between Locations and Images for Effective Worldwide Geo-localization
satai
3
120
NLP2025参加報告会 LT資料
hargon24
1
280
大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成
nomamist
1
170
定性データ、どう活かす? 〜定性データのための分析基盤、はじめました〜 / How to utilize qualitative data? ~We have launched an analysis platform for qualitative data~
kaminashi
6
840
CARMUI-NET:自動運転車遠隔監視のためのバーチャル都市プラットフォームにおける通信品質変動機能の開発と評価 / UBI85
yumulab
0
160
Featured
See All Featured
How to Think Like a Performance Engineer
csswizardry
23
1.5k
Navigating Team Friction
lara
184
15k
Being A Developer After 40
akosma
91
590k
4 Signs Your Business is Dying
shpigford
183
22k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Automating Front-end Workflow
addyosmani
1369
200k
Building Adaptive Systems
keathley
41
2.5k
Adopting Sorbet at Scale
ufuk
76
9.3k
For a Future-Friendly Web
brad_frost
176
9.7k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.3k
A Tale of Four Properties
chriscoyier
158
23k
Designing for Performance
lara
608
69k
Transcript
画像生成技術の発展: 過去10年の軌跡と未来への展望 2024.6.12 石井 雅人(Sony Research Inc.)
None
None
None
None
None
None
None
None
None
None
None
None
𝑝(𝑧)
𝑝(𝑧)
None
None
None
⇒
None
None
None
None
None
None
None
None
𝑥𝑇 𝑥𝑡−1 𝑥𝑡 𝑥0 𝑝𝜃 (𝑥𝑡−1 |𝑥𝑡 ) 𝑞(𝑥𝑡 |𝑥𝑡−1
)
× 𝑇 × 𝑇 × 𝑇
𝑥𝑡0−1 𝑥𝑡0 𝑥0 𝑥𝑇 𝑡0
None
None
None
… … … … … … 𝑧𝑑+1:𝐷 𝑧1:𝑑 𝑧 𝑧1:𝑑
′ 𝑧𝑑+1:𝐷 ′ 𝑧′ 𝑧′ = 𝑧1:𝑑 , 𝑧𝑑+1:𝐷 + 𝑔 𝑧1:𝑑 𝑔(𝑧1:𝑑 ) 𝑧 = 𝑧1:𝑑 ′ , 𝑧𝑑+1:𝐷 ′ − 𝑔 𝑧1:𝑑 ′
𝐳𝑡+1 = 𝐳𝑡 + 𝑓𝑡 (𝐳𝑡 ) d𝐳(𝑡) d𝑡 =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳 𝑡 𝑓0 𝑓1 𝑓𝑇
𝐳 𝑡 𝐳 𝑡
𝐳 𝑡
None
𝐳 𝑡 𝐳 𝑡
d𝐳(𝑡) d𝑡 = 𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳(1) =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡
None
None
•