Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20260318_AIによるデザインレビュ〜「画像の美しさ」をスコアに変換する〜

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for Hiroshi Kato Hiroshi Kato
March 19, 2026
47

 20260318_AIによるデザインレビュ〜「画像の美しさ」をスコアに変換する〜

Avatar for Hiroshi Kato

Hiroshi Kato

March 19, 2026
Tweet

More Decks by Hiroshi Kato

Transcript

  1. 評価のブレを防ぐアプローチ CLIP(Contrastive Language–Image Pretraining) MLP(Multi Layer Perceptron) Aesthetic Predictor(CLIP+MLP) •

    感覚的な「美しさ」を、数学的な「スコア」に変換する仕組み • OpenAIが作ったモデル(2021年) • 約4億枚の画像とテキストペアで学習済み • 画像を768次元の特徴ベクトルに変換する • 人間の評価データ(AVAデータセット)で学習された回帰モデル • CLIPの特徴から「人間なら何点をつけるか」を予測する
  2. AWS Serverlessによる構成 SageMaker Endpoint Model ECR S3 Client • aesthetic_model.pth(モデル)

    • inference.py(推論実行ファイル) • Dockerイメージ(実行環境) POST スコア エンドポイント生成 モデル生成 CLIP MLP 768次元 ベクトル Aesthetic スコア Docker Container
  3. APIを叩いてスコアを出してみる (.venv) xxxxx% aws sagemaker-runtime invoke-endpoint ¥ --endpoint-name aesthetic-endpoint ¥

    --body fileb://payload2.json ¥ --content-type application/json ¥ --region us-east-1 ¥ /tmp/out.json && cat /tmp/out.json { "ContentType": "application/json", "InvokedProductionVariant": "variant-name-1" } {"score": 4.085611820220947}% • スコアは0〜10のスケール • 初回レスポンス:約2〜3秒(コールドスタート)
  4. まとめ • CLIP(約4億枚学習済み)+ MLP で美しさを数値化 • LLMに直接聞くより、一貫性のある客観スコアが得られる • ECR +

    SageMaker Serverless でインフラ管理なしにAPI化 • サーバーレスなので使った分だけ課金