20260318_AIによるデザインレビュ〜「画像の美しさ」をスコアに変換する〜

AIによるデザインレビュー〜「画像の美しさ」をスコアに変換する〜 JAWS-UG名古屋 2026年3月18日（水）

自己紹介加藤寛士（かとうひろし） • クラウドエンジニア • JAWS-UG 名古屋運営 @Hircha12

ちょっとした興味からはじめてみました • AIで「画像の美しさ」を採点できないか？ • 一貫性のあるスコアを算定したい • 人による評価のバラつきをなくしたい

LLMに直接「採点して」と聞かない理由出力：評価の言語化課題：評価のブレ出力：数値による採点強み：常に一定の結果再現性がある LLMに直接プロンプト専用モデルでの算出

評価のブレを防ぐアプローチ CLIP（Contrastive Language–Image Pretraining） MLP（Multi Layer Perceptron） Aesthetic Predictor（CLIP＋MLP） •
感覚的な「美しさ」を、数学的な「スコア」に変換する仕組み • OpenAIが作ったモデル（2021年） • 約4億枚の画像とテキストペアで学習済み • 画像を768次元の特徴ベクトルに変換する • 人間の評価データ（AVAデータセット）で学習された回帰モデル • CLIPの特徴から「人間なら何点をつけるか」を予測する

画像をスコアに変換するステップ CLIP MLP Embedding 画像を数値ベクトルに変換数値ベクトルから「美しさ」のスコアを計算 768次元
ベクトル Aesthetic スコア

AWS Serverlessによる構成 SageMaker Endpoint Model ECR S3 Client • aesthetic_model.pth（モデル）
• inference.py（推論実行ファイル） • Dockerイメージ（実行環境） POST スコアエンドポイント生成モデル生成 CLIP MLP 768次元ベクトル Aesthetic スコア Docker Container

APIを叩いてスコアを出してみる (.venv) xxxxx% aws sagemaker-runtime invoke-endpoint ¥ --endpoint-name aesthetic-endpoint ¥
--body fileb://payload2.json ¥ --content-type application/json ¥ --region us-east-1 ¥ /tmp/out.json && cat /tmp/out.json { "ContentType": "application/json", "InvokedProductionVariant": "variant-name-1" } {"score": 4.085611820220947}% • スコアは0〜10のスケール • 初回レスポンス：約2〜3秒（コールドスタート）

APIを叩いてスコアを出してみる 4.225589275360107 4.089179515838623 4.277888298034668 4.199540138244629

APIを叩いてスコアを出してみる 3.896981716156006 世界一ブサイクと認定された深海魚の画像

まとめ • CLIP（約4億枚学習済み）＋ MLP で美しさを数値化 • LLMに直接聞くより、一貫性のある客観スコアが得られる • ECR +
SageMaker Serverless でインフラ管理なしにAPI化 • サーバーレスなので使った分だけ課金

20260318_AIによるデザインレビュ〜「画像の美しさ」をスコアに変換する〜

20260318_AIによるデザインレビュ〜「画像の美しさ」をスコアに変換する〜

Hiroshi Kato

More Decks by Hiroshi Kato

Featured

Transcript

AIによるデザインレビュー〜「画像の美しさ」をスコアに変換する〜 JAWS-UG名古屋 2026年3月18日（水）

自己紹介加藤寛士（かとうひろし） • クラウドエンジニア • JAWS-UG 名古屋運営 @Hircha12

ちょっとした興味からはじめてみました • AIで「画像の美しさ」を採点できないか？ • 一貫性のあるスコアを算定したい • 人による評価のバラつきをなくしたい

LLMに直接「採点して」と聞かない理由出力：評価の言語化課題：評価のブレ出力：数値による採点強み：常に一定の結果再現性がある LLMに直接プロンプト専用モデルでの算出

評価のブレを防ぐアプローチ CLIP（Contrastive Language–Image Pretraining） MLP（Multi Layer Perceptron） Aesthetic Predictor（CLIP＋MLP） •

画像をスコアに変換するステップ CLIP MLP Embedding 画像を数値ベクトルに変換数値ベクトルから「美しさ」のスコアを計算 768次元

AWS Serverlessによる構成 SageMaker Endpoint Model ECR S3 Client • aesthetic_model.pth（モデル）

APIを叩いてスコアを出してみる (.venv) xxxxx% aws sagemaker-runtime invoke-endpoint ¥ --endpoint-name aesthetic-endpoint ¥

APIを叩いてスコアを出してみる 4.225589275360107 4.089179515838623 4.277888298034668 4.199540138244629

APIを叩いてスコアを出してみる 3.896981716156006 世界一ブサイクと認定された深海魚の画像

まとめ • CLIP（約4億枚学習済み）＋ MLP で美しさを数値化 • LLMに直接聞くより、一貫性のある客観スコアが得られる • ECR +