Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
画像生成AIを使って勝負しよう
Search
Satoshi Gachi Fujimoto
March 15, 2024
Technology
1
130
画像生成AIを使って勝負しよう
熊本学園大学×熊本県情報サービス産業協会連携事業「まちの課題をICTとデータで解決する」第3回 オープンカンファレンスのLT資料です
Satoshi Gachi Fujimoto
March 15, 2024
Tweet
Share
More Decks by Satoshi Gachi Fujimoto
See All by Satoshi Gachi Fujimoto
バスあと何分ミニサイネージ
satoshirobatofujimoto
0
120
高専で制御を、大学でセンシングを学び、次は脳みそ
satoshirobatofujimoto
0
290
ガチマナ会 vol.1
satoshirobatofujimoto
0
240
画像生成AIを使って勝負しよう
satoshirobatofujimoto
0
260
画像からプロンプトを考えて最も似ている画像を生成した人が勝ちのゲーム@AIミーティング
satoshirobatofujimoto
0
170
VPS研究者が語る”VPS概論”
satoshirobatofujimoto
0
430
画像からプロンプトを考えて最も似ている画像を生成した人が勝ちのゲーム
satoshirobatofujimoto
0
220
OpenAI 新機能まとめ(Function callingとAdd your data編)
satoshirobatofujimoto
0
280
PLATEAUを用いた熊本市中心市街地におけるバリアフリー情報の可視化
satoshirobatofujimoto
0
1.1k
Other Decks in Technology
See All in Technology
帳票Vibe Coding
terurou
0
140
ドキュメントはAIの味方!スタートアップのアジャイルを加速するADR
kawauso
3
380
小さなチーム 大きな仕事 - 個人開発でAIをフル活用する
himaratsu
0
120
人と組織に偏重したEMへのアンチテーゼ──なぜ、EMに設計力が必要なのか/An antithesis to the overemphasis of people and organizations in EM
dskst
6
620
[CV勉強会@関東 CVPR2025 読み会] MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos (Li+, CVPR2025)
abemii
0
190
Understanding Go GC #coefl_go_jp
bengo4com
0
1.1k
LLM時代の検索とコンテキストエンジニアリング
shibuiwilliam
2
1.1k
LLMエージェント時代に適応した開発フロー
hiragram
1
410
VPC Latticeのサービスエンドポイント機能を使用した複数VPCアクセス
duelist2020jp
0
240
コスト削減の基本の「キ」~ コスト消費3大リソースへの対策 ~
smt7174
2
140
あなたの知らない OneDrive
murachiakira
0
240
Preferred Networks (PFN) とLLM Post-Training チームの紹介 / 第4回 関東Kaggler会 スポンサーセッション
pfn
PRO
1
220
Featured
See All Featured
Code Review Best Practice
trishagee
70
19k
Six Lessons from altMBA
skipperchong
28
4k
Done Done
chrislema
185
16k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Balancing Empowerment & Direction
lara
2
590
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
183
54k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
We Have a Design System, Now What?
morganepeng
53
7.7k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.5k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.8k
A designer walks into a library…
pauljervisheath
207
24k
Code Reviewing Like a Champion
maltzj
525
40k
Transcript
2024/3/16 第3回 オープンカンファレンス 画像生成AIを使って 勝負しよう
がちもとさん KumaMCNという技術コミュニティを運営 株式会社ナレッジコミュニケーションでAI・XRアプリ開発 崇城大学古賀都市計画研究室の技術顧問でまちづくりの研究 高専で制御を、大学でセンシングを学び、次は脳みそ @sotongshi
お題の画像を見て、プロンプトを考えましょう ※制限時間は90秒
プロンプトを入力して画像を生成、類似度で競います! ※1に近いほど類似しています
類似度の算出方法 ・ Learned Perceptual Image Patch Similarity (LPIPS) は、AlexNetやVGGなどの学習済 み画像分類ネットワークの畳み込み層が出力する特徴量を基に類似度を算出する手法
・従来のピクセル単位の差異とは異なり、画像の内容と構造をより深く理解 ・人間の目が感じる類似性に近い https://qiita.com/SatoshiGachiFujimoto/items/651472942a4885181442 https://github.com/richzhang/PerceptualSimilarity import lpips import torch import torchvision.transforms.functional as TF from PIL import Image loss_fn_alex = lpips.LPIPS(net='alex') # best forward scores path_img0 = "groundtruth.png" path_img1 = "1.png" img0 = Image.open(path_img0) img0 = img0.convert("RGB") img0 = (TF.to_tensor(img0) - 0.5) * 2 img0.unsqueeze(0) img1 = Image.open(path_img1) img1 = img1.convert("RGB") img1 = (TF.to_tensor(img1) - 0.5) * 2 img1.unsqueeze(0) d = loss_fn_alex(img0, img1) print("Perceptual loss",1-d.item()) # 1に近づくほど似ているように変更
やってみよう
お題 こちらから回答お願いします https://forms.gle/ezqf5P6STz2asFCH6
None
None
None
None
ご清聴ありがとうございました