Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Marigold
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Monta Yashi
December 09, 2023
Technology
370
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Marigold
1枚の画像からDepthを推定する、生成系AIのMarigoldを使ってみた話
Monta Yashi
December 09, 2023
More Decks by Monta Yashi
See All by Monta Yashi
クロスワードを GPT4と量子コンピュータに解かせよう
84monta
0
130
虫食い算を最適化で解決する
84monta
0
150
幸せをさがし続けて 真実に気づいた話
84monta
0
100
AIと最適化の違いをうっかり聞いてしまう前に
84monta
0
440
Other Decks in Technology
See All in Technology
Databricks における 生成AIガバナンスの実践
taka_aki
1
350
実装は速くなった、レビューはどうする? ― 自身のレビューをAIで再現させるサーヴァントエンジニアリングのすゝめ / Implementation got faster. So what about reviews? — An invitation to Servant Engineering: Recreating your own code reviews with AI
nrslib
7
4.2k
ブロックチェーン / Blockchain
ks91
PRO
0
110
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
200
ITエンジニアを取り巻く環境とキャリアパス / A career path for Japanese IT engineers
takatama
4
1.8k
Terraformモジュールは、なぜ「魔境」化するのか
hayama17
2
210
速さだけじゃない! VoidZero ツールが移行先に選ばれる理由
mizdra
PRO
6
770
TypeScript Compiler APIとPHP-Parserを活用し、TypeScriptとPHPで型を共有する
shuta13
0
370
React、まだ楽しくて草
uhyo
7
4.2k
個人の発見を、組織の知恵に 〜生成AI活用を"探索"から"組織の仕組み"へ〜
kintotechdev
3
1.1k
Ruby::Boxでできること、Refinementsでできること
joker1007
3
400
サプライチェーンセキュリティの空白地帯 - 信頼できる”依存性”の未来を考える
rung
PRO
2
780
Featured
See All Featured
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
720
Color Theory Basics | Prateek | Gurzu
gurzu
0
360
Building the Perfect Custom Keyboard
takai
2
780
YesSQL, Process and Tooling at Scale
rocio
174
15k
Building Applications with DynamoDB
mza
96
7.1k
HTML-Aware ERB: The Path to Reactive Rendering @ RubyCon 2026, Rimini, Italy
marcoroth
1
160
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
240
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
250
Context Engineering - Making Every Token Count
addyosmani
9
950
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
390
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
190
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.3k
Transcript
Marigold!
マリーゴールド マリーゴールド(英語: marigold、学名 :Tagetes)。キク科コウオウソウ属(マンジュ ギク属)のうち草花として栽培される植物の 総称。 by Wikipedia
Not That one!
こっち! Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation 分かりやすく言うと
1枚の絵から奥行きを推定するAI (拡散モデル) URL:https://github.com/prs-eth/Marigold
何がすごいか? 最近のトレンド 動画→3D 3D Gaussian Splatting、NeRF、SLAM (画像間の変化から奥行きを推定する ) Mrigoldは1枚の画像から奥行きを推測する。 …存在しない奥行きデータを作る!?
*Ground Truthよりちょいよい 良いのが笑えます。
ほんまかいな? (検証)
インストール方法(GitHubの手順まま) ▪リポジトリからクローン git clone https://github.com/prs-eth/Marigold.git cd Marigold ▪依存するライブラリをインストール python -m
venv venv/marigold source venv/marigold/bin/activate pip install -r requirements.txt ▪実行 python run.py --input_rgb_dir 入力フォルダ --output_dir 出力フォルダ *入力フォルダにJpegファイルを突っ込めばOK。
実行結果 入力ファイル 出力ファイル 入力サイズ:2268x4032 出力サイズ:2268x4032 処理時間:50秒 処理マシン: CPU:AMD Ryzen7 2700x
8core Mem:64GB GPU: GeForce 1080 GTX
Depthみても実感わかない
人間用に変換 どこのご家庭にもある Looking Glass Portrait 裸眼で3Dに見える優れモノ *最近新しいクラファン始まっています。 興味ある方はぜひ
LookingGlassで見るための手順 ① 元RGBファイルと、Depthを1枚にヨコ並 びとした画像を作成し、Jpegなどで保存す る。 ② HoloPlay Studioを起動し、ADD HOLOGRAMからファイルを追加。 PROPERTIESをいい具合にいじる。
Depthが逆になるの でこれチェック
検証(感想) 食べ物写真 Pixelでポートレイトで撮影した写真 元画像はポートレイトモードのためボケが あり綺麗に見える写真。 Looking Glassで立体化してみると、より アップルパイ&アイスクリームがフォーカ スされておいしそうに見える
検証(感想) 近距離の写真 Pixelの通常のモードで撮影したもの。 元画像はボケもなく素直な写真。 無理やりな3D感もなく比較的自然。 親指系のLowProfileキーが少し手前に 認識されているか。ProMicroも深い。 が、メインのキー部分が自然なのでそれ ほど違和感はない。
検証(感想) 夜景 東京の夜景を撮影したもの。 元画像は、新しい高層ビル群に挟まれた 東京タワーの色が、あいにくの空模様も 相まって映える写真。 周辺ビルはソコソコなんですが、肝心の 東京タワーが全くダメ 中央の人はかなり正しく認識されている ため、その部分にフォーカスするとそれな
り。
まとめ 論文通り、かなり良い。 夜景などはあまり得意ではなさそう。 眠っているLooking Glass Portraitを引き出して遊ぶのもよさそう。