Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20260318_AIによるデザインレビュ〜「画像の美しさ」をスコアに変換する〜
Search
Hiroshi Kato
March 19, 2026
81
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20260318_AIによるデザインレビュ〜「画像の美しさ」をスコアに変換する〜
Hiroshi Kato
March 19, 2026
More Decks by Hiroshi Kato
See All by Hiroshi Kato
TelemetryAPIでLambda関数の外側を覗く
kahiro
0
4
DurableExecutionを実装検証から理解する.pdf
kahiro
1
45
20260110_オンプレ思考からクラウドネイティブ思考への転換レシピ
kahiro
0
13
20251114_Amazon_Q_DeveloperでMCPを使う_最初の一歩__.pdf
kahiro
0
15
20250829_LambdaとStepFunctionsどちらを選ぶべき_コスト視点で考えてみる.pdf
kahiro
1
460
Step_Functions_をはじめよう_JSONataによる進化_.pdf
kahiro
2
160
20250706_AWSでランサムウェア対策_バックアップが最大の防御_.pdf
kahiro
0
390
20250701_VMwareワークロードのAWS移行を学ぶ.pdf
kahiro
0
140
20250412_JAWS-UG北陸新幹線.pdf
kahiro
0
130
Featured
See All Featured
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Balancing Empowerment & Direction
lara
6
1.1k
GitHub's CSS Performance
jonrohan
1033
470k
Between Models and Reality
mayunak
4
330
Mind Mapping
helmedeiros
PRO
1
240
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
390
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
AI: The stuff that nobody shows you
jnunemaker
PRO
8
690
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
360
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
350
Transcript
AIによるデザインレビュー 〜「画像の美しさ」をスコアに変換する〜 JAWS-UG名古屋 2026年3月18日(水)
自己紹介 加藤 寛士(かとう ひろし) • クラウドエンジニア • JAWS-UG 名古屋運営 @Hircha12
ちょっとした興味からはじめてみました • AIで「画像の美しさ」を採点できないか? • 一貫性のあるスコアを算定したい • 人による評価のバラつきをなくしたい
LLMに直接「採点して」と聞かない理由 出力:評価の言語化 課題:評価のブレ 出力:数値による採点 強み:常に一定の結果 再現性がある LLMに直接プロンプト 専用モデルでの算出
評価のブレを防ぐアプローチ CLIP(Contrastive Language–Image Pretraining) MLP(Multi Layer Perceptron) Aesthetic Predictor(CLIP+MLP) •
感覚的な「美しさ」を、数学的な「スコア」に変換する仕組み • OpenAIが作ったモデル(2021年) • 約4億枚の画像とテキストペアで学習済み • 画像を768次元の特徴ベクトルに変換する • 人間の評価データ(AVAデータセット)で学習された回帰モデル • CLIPの特徴から「人間なら何点をつけるか」を予測する
画像をスコアに変換するステップ CLIP MLP Embedding 画像を数値ベクトル に変換 数値ベクトルから 「美しさ」のスコア を計算 768次元
ベクトル Aesthetic スコア
AWS Serverlessによる構成 SageMaker Endpoint Model ECR S3 Client • aesthetic_model.pth(モデル)
• inference.py(推論実行ファイル) • Dockerイメージ(実行環境) POST スコア エンドポイント生成 モデル生成 CLIP MLP 768次元 ベクトル Aesthetic スコア Docker Container
APIを叩いてスコアを出してみる (.venv) xxxxx% aws sagemaker-runtime invoke-endpoint ¥ --endpoint-name aesthetic-endpoint ¥
--body fileb://payload2.json ¥ --content-type application/json ¥ --region us-east-1 ¥ /tmp/out.json && cat /tmp/out.json { "ContentType": "application/json", "InvokedProductionVariant": "variant-name-1" } {"score": 4.085611820220947}% • スコアは0〜10のスケール • 初回レスポンス:約2〜3秒(コールドスタート)
APIを叩いてスコアを出してみる 4.225589275360107 4.089179515838623 4.277888298034668 4.199540138244629
APIを叩いてスコアを出してみる 3.896981716156006 世界一ブサイクと認定された深海魚の画像
まとめ • CLIP(約4億枚学習済み)+ MLP で美しさを数値化 • LLMに直接聞くより、一貫性のある客観スコアが得られる • ECR +
SageMaker Serverless でインフラ管理なしにAPI化 • サーバーレスなので使った分だけ課金