Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Marigold
Search
Monta Yashi
December 09, 2023
Technology
0
340
Marigold
1枚の画像からDepthを推定する、生成系AIのMarigoldを使ってみた話
Monta Yashi
December 09, 2023
Tweet
Share
More Decks by Monta Yashi
See All by Monta Yashi
クロスワードを GPT4と量子コンピュータに解かせよう
84monta
0
120
虫食い算を最適化で解決する
84monta
0
140
幸せをさがし続けて 真実に気づいた話
84monta
0
95
AIと最適化の違いをうっかり聞いてしまう前に
84monta
0
420
Other Decks in Technology
See All in Technology
業務効率化をさらに加速させる、ノーコードツールとStep Functionsのハイブリッド化
smt7174
2
140
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
3
5.5k
技育祭2025【秋】 企業ピッチ/登壇資料(高橋 悟生)
hacobu
PRO
0
100
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
3
20k
小学4年生夏休みの自由研究「ぼくと Copilot エージェント」
taichinakamura
0
700
Claude Codeを駆使した初めてのiOSアプリ開発 ~ゼロから3週間でグローバルハッカソンで入賞するまで~
oikon48
1
540
JAZUG 15周年記念 × JAT「AI Agent開発者必見:"今"のOracle技術で拡張するAzure × OCIの共存アーキテクチャ」
shisyu_gaku
1
160
これがLambdaレス時代のChatOpsだ!実例で学ぶAmazon Q Developerカスタムアクション活用法
iwamot
PRO
6
1k
20251007: What happens when multi-agent systems become larger? (CyberAgent, Inc)
ornew
1
270
フレームワークを意識させないワークショップづくり
keigosuda
0
160
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
2.8k
"プロポーザルってなんか怖そう"という境界を超えてみた@TSUDOI by giftee Tech #1
shilo113
0
190
Featured
See All Featured
The Pragmatic Product Professional
lauravandoore
36
6.9k
Docker and Python
trallard
46
3.6k
Git: the NoSQL Database
bkeepers
PRO
431
66k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
870
Become a Pro
speakerdeck
PRO
29
5.5k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Measuring & Analyzing Core Web Vitals
bluesmoon
9
620
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.9k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Transcript
Marigold!
マリーゴールド マリーゴールド(英語: marigold、学名 :Tagetes)。キク科コウオウソウ属(マンジュ ギク属)のうち草花として栽培される植物の 総称。 by Wikipedia
Not That one!
こっち! Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation 分かりやすく言うと
1枚の絵から奥行きを推定するAI (拡散モデル) URL:https://github.com/prs-eth/Marigold
何がすごいか? 最近のトレンド 動画→3D 3D Gaussian Splatting、NeRF、SLAM (画像間の変化から奥行きを推定する ) Mrigoldは1枚の画像から奥行きを推測する。 …存在しない奥行きデータを作る!?
*Ground Truthよりちょいよい 良いのが笑えます。
ほんまかいな? (検証)
インストール方法(GitHubの手順まま) ▪リポジトリからクローン git clone https://github.com/prs-eth/Marigold.git cd Marigold ▪依存するライブラリをインストール python -m
venv venv/marigold source venv/marigold/bin/activate pip install -r requirements.txt ▪実行 python run.py --input_rgb_dir 入力フォルダ --output_dir 出力フォルダ *入力フォルダにJpegファイルを突っ込めばOK。
実行結果 入力ファイル 出力ファイル 入力サイズ:2268x4032 出力サイズ:2268x4032 処理時間:50秒 処理マシン: CPU:AMD Ryzen7 2700x
8core Mem:64GB GPU: GeForce 1080 GTX
Depthみても実感わかない
人間用に変換 どこのご家庭にもある Looking Glass Portrait 裸眼で3Dに見える優れモノ *最近新しいクラファン始まっています。 興味ある方はぜひ
LookingGlassで見るための手順 ① 元RGBファイルと、Depthを1枚にヨコ並 びとした画像を作成し、Jpegなどで保存す る。 ② HoloPlay Studioを起動し、ADD HOLOGRAMからファイルを追加。 PROPERTIESをいい具合にいじる。
Depthが逆になるの でこれチェック
検証(感想) 食べ物写真 Pixelでポートレイトで撮影した写真 元画像はポートレイトモードのためボケが あり綺麗に見える写真。 Looking Glassで立体化してみると、より アップルパイ&アイスクリームがフォーカ スされておいしそうに見える
検証(感想) 近距離の写真 Pixelの通常のモードで撮影したもの。 元画像はボケもなく素直な写真。 無理やりな3D感もなく比較的自然。 親指系のLowProfileキーが少し手前に 認識されているか。ProMicroも深い。 が、メインのキー部分が自然なのでそれ ほど違和感はない。
検証(感想) 夜景 東京の夜景を撮影したもの。 元画像は、新しい高層ビル群に挟まれた 東京タワーの色が、あいにくの空模様も 相まって映える写真。 周辺ビルはソコソコなんですが、肝心の 東京タワーが全くダメ 中央の人はかなり正しく認識されている ため、その部分にフォーカスするとそれな
り。
まとめ 論文通り、かなり良い。 夜景などはあまり得意ではなさそう。 眠っているLooking Glass Portraitを引き出して遊ぶのもよさそう。