Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Marigold
Search
Monta Yashi
December 09, 2023
Technology
0
340
Marigold
1枚の画像からDepthを推定する、生成系AIのMarigoldを使ってみた話
Monta Yashi
December 09, 2023
Tweet
Share
More Decks by Monta Yashi
See All by Monta Yashi
クロスワードを GPT4と量子コンピュータに解かせよう
84monta
0
110
虫食い算を最適化で解決する
84monta
0
130
幸せをさがし続けて 真実に気づいた話
84monta
0
93
AIと最適化の違いをうっかり聞いてしまう前に
84monta
0
410
Other Decks in Technology
See All in Technology
バイブスに「型」を!Kent Beckに学ぶ、AI時代のテスト駆動開発
amixedcolor
2
540
Function Body Macros で、SwiftUI の View に Accessibility Identifier を自動付与する/Function Body Macros: Autogenerate accessibility identifiers for SwiftUI Views
miichan
2
180
ChatGPTとPlantUML/Mermaidによるソフトウェア設計
gowhich501
1
130
Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレイクスルーの鍵を握るのはデータ領域」
shisyu_gaku
0
160
La gouvernance territoriale des données grâce à la plateforme Terreze
bluehats
0
170
EncryptedSharedPreferences が deprecated になっちゃった!どうしよう! / Oh no! EncryptedSharedPreferences has been deprecated! What should I do?
yanzm
0
270
オブザーバビリティが広げる AIOps の世界 / The World of AIOps Expanded by Observability
aoto
PRO
0
370
テストを軸にした生き残り術
kworkdev
PRO
0
200
なぜテストマネージャの視点が 必要なのか? 〜 一歩先へ進むために 〜
moritamasami
0
220
Evolución del razonamiento matemático de GPT-4.1 a GPT-5 - Data Aventura Summit 2025 & VSCode DevDays
lauchacarro
0
190
MCPで変わる Amebaデザインシステム「Spindle」の開発
spindle
PRO
3
3.2k
なぜSaaSがMCPサーバーをサービス提供するのか?
sansantech
PRO
8
2.8k
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
Rails Girls Zürich Keynote
gr2m
95
14k
Producing Creativity
orderedlist
PRO
347
40k
Testing 201, or: Great Expectations
jmmastey
45
7.7k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
13k
Practical Orchestrator
shlominoach
190
11k
Automating Front-end Workflow
addyosmani
1370
200k
Building Adaptive Systems
keathley
43
2.7k
The World Runs on Bad Software
bkeepers
PRO
70
11k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Unsuck your backbone
ammeep
671
58k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.4k
Transcript
Marigold!
マリーゴールド マリーゴールド(英語: marigold、学名 :Tagetes)。キク科コウオウソウ属(マンジュ ギク属)のうち草花として栽培される植物の 総称。 by Wikipedia
Not That one!
こっち! Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation 分かりやすく言うと
1枚の絵から奥行きを推定するAI (拡散モデル) URL:https://github.com/prs-eth/Marigold
何がすごいか? 最近のトレンド 動画→3D 3D Gaussian Splatting、NeRF、SLAM (画像間の変化から奥行きを推定する ) Mrigoldは1枚の画像から奥行きを推測する。 …存在しない奥行きデータを作る!?
*Ground Truthよりちょいよい 良いのが笑えます。
ほんまかいな? (検証)
インストール方法(GitHubの手順まま) ▪リポジトリからクローン git clone https://github.com/prs-eth/Marigold.git cd Marigold ▪依存するライブラリをインストール python -m
venv venv/marigold source venv/marigold/bin/activate pip install -r requirements.txt ▪実行 python run.py --input_rgb_dir 入力フォルダ --output_dir 出力フォルダ *入力フォルダにJpegファイルを突っ込めばOK。
実行結果 入力ファイル 出力ファイル 入力サイズ:2268x4032 出力サイズ:2268x4032 処理時間:50秒 処理マシン: CPU:AMD Ryzen7 2700x
8core Mem:64GB GPU: GeForce 1080 GTX
Depthみても実感わかない
人間用に変換 どこのご家庭にもある Looking Glass Portrait 裸眼で3Dに見える優れモノ *最近新しいクラファン始まっています。 興味ある方はぜひ
LookingGlassで見るための手順 ① 元RGBファイルと、Depthを1枚にヨコ並 びとした画像を作成し、Jpegなどで保存す る。 ② HoloPlay Studioを起動し、ADD HOLOGRAMからファイルを追加。 PROPERTIESをいい具合にいじる。
Depthが逆になるの でこれチェック
検証(感想) 食べ物写真 Pixelでポートレイトで撮影した写真 元画像はポートレイトモードのためボケが あり綺麗に見える写真。 Looking Glassで立体化してみると、より アップルパイ&アイスクリームがフォーカ スされておいしそうに見える
検証(感想) 近距離の写真 Pixelの通常のモードで撮影したもの。 元画像はボケもなく素直な写真。 無理やりな3D感もなく比較的自然。 親指系のLowProfileキーが少し手前に 認識されているか。ProMicroも深い。 が、メインのキー部分が自然なのでそれ ほど違和感はない。
検証(感想) 夜景 東京の夜景を撮影したもの。 元画像は、新しい高層ビル群に挟まれた 東京タワーの色が、あいにくの空模様も 相まって映える写真。 周辺ビルはソコソコなんですが、肝心の 東京タワーが全くダメ 中央の人はかなり正しく認識されている ため、その部分にフォーカスするとそれな
り。
まとめ 論文通り、かなり良い。 夜景などはあまり得意ではなさそう。 眠っているLooking Glass Portraitを引き出して遊ぶのもよさそう。