Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
Search
画像センシングシンポジウム
PRO
June 12, 2024
Research
3
2.4k
SSII2024 [OS1] 画像生成技術の発展: 過去10年の軌跡と未来への展望
画像センシングシンポジウム
PRO
June 12, 2024
Tweet
Share
More Decks by 画像センシングシンポジウム
See All by 画像センシングシンポジウム
SSII2024 [OS1] 自動運転における 重要技術とトレンド紹介
ssii
PRO
0
940
SSII2024 [PD] SSIIアナザーストーリーズ
ssii
PRO
0
250
SSII2024 [OS1] 現場の課題を解決する ロボットラーニング
ssii
PRO
0
750
SSII2024 [OS1] 画像認識におけるモデル・データの共進化
ssii
PRO
0
720
SSII2024 [OS1] 研究紹介100連発(オープンニング)
ssii
PRO
0
610
SSII2024 [OS2] 大規模言語モデルと基盤モデルの射程
ssii
PRO
0
610
SSII2024 [OS2] 画像、その先へ 〜モーション解析への誘い〜
ssii
PRO
1
1.3k
SSII2024 [OS2] 大規模言語モデルとVision & Languageのこれから
ssii
PRO
5
1.6k
SSII2024 [OS2] GPT-4Vで画像認識は終わるのか(オープニング)
ssii
PRO
0
920
Other Decks in Research
See All in Research
Neural Fieldの紹介
nnchiba
2
700
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)
reisato12345
0
340
ベイズ的方法に基づく統計的因果推論の基礎
holyshun
0
820
大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成
nomamist
0
110
渋谷Well-beingアンケート調査結果
shibuyasmartcityassociation
0
400
非ガウス性と非線形性に基づく統計的因果探索
sshimizu2006
0
550
Poster: Feasibility of Runtime-Neutral Wasm Instrumentation for Edge-Cloud Workload Handover
chikuwait
0
350
VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding
sansan_randd
1
460
eAI (Engineerable AI) プロジェクトの全体像 / Overview of eAI Project
ishikawafyu
0
380
Gemini と Looker で営業DX をドライブする / Driving Sales DX with Gemini and Looker
sansan_randd
0
130
[ECCV2024読み会] 衛星画像からの地上画像生成
elith
1
1.1k
Weekly AI Agents News! 11月号 論文のアーカイブ
masatoto
0
300
Featured
See All Featured
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.1k
Rebuilding a faster, lazier Slack
samanthasiow
80
8.9k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Become a Pro
speakerdeck
PRO
26
5.2k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
1k
Building Applications with DynamoDB
mza
93
6.2k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.7k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
49
2.3k
Writing Fast Ruby
sferik
628
61k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
46
2.3k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.2k
Transcript
画像生成技術の発展: 過去10年の軌跡と未来への展望 2024.6.12 石井 雅人(Sony Research Inc.)
None
None
None
None
None
None
None
None
None
None
None
None
𝑝(𝑧)
𝑝(𝑧)
None
None
None
⇒
None
None
None
None
None
None
None
None
𝑥𝑇 𝑥𝑡−1 𝑥𝑡 𝑥0 𝑝𝜃 (𝑥𝑡−1 |𝑥𝑡 ) 𝑞(𝑥𝑡 |𝑥𝑡−1
)
× 𝑇 × 𝑇 × 𝑇
𝑥𝑡0−1 𝑥𝑡0 𝑥0 𝑥𝑇 𝑡0
None
None
None
… … … … … … 𝑧𝑑+1:𝐷 𝑧1:𝑑 𝑧 𝑧1:𝑑
′ 𝑧𝑑+1:𝐷 ′ 𝑧′ 𝑧′ = 𝑧1:𝑑 , 𝑧𝑑+1:𝐷 + 𝑔 𝑧1:𝑑 𝑔(𝑧1:𝑑 ) 𝑧 = 𝑧1:𝑑 ′ , 𝑧𝑑+1:𝐷 ′ − 𝑔 𝑧1:𝑑 ′
𝐳𝑡+1 = 𝐳𝑡 + 𝑓𝑡 (𝐳𝑡 ) d𝐳(𝑡) d𝑡 =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳 𝑡 𝑓0 𝑓1 𝑓𝑇
𝐳 𝑡 𝐳 𝑡
𝐳 𝑡
None
𝐳 𝑡 𝐳 𝑡
d𝐳(𝑡) d𝑡 = 𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡 𝐳(1) =
𝑓(𝐳𝑡 , 𝑡) 𝐳 𝑡
None
None
•