Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amazon Bedrock における モデルカスタマイズについて考えてみた

Avatar for Morita Morita
March 31, 2026
0

Amazon Bedrock における モデルカスタマイズについて考えてみた

JAWS-UGAI_ML#34

Avatar for Morita

Morita

March 31, 2026
Tweet

More Decks by Morita

Transcript

  1. Reinforcement Fine-tuning (RFT) • 強化学習の仕組みを LLM の学習(Fine-tuning)に適⽤ ◦ SFTと⽐較すると複雑なワークフローでの学習 →

    Bedrock を利⽤すれば、マネージドに学習可能 • 「より⾼い評価が得られる回答の作り⽅」を学習させることが可能 → 柔軟性を損ないにくく、新しい知識を得ることができる • 「形式の模倣」には不向き Reinforcement Fine-tuning (RFT)
  2. SFT RFT ユースケース 厳格に知識に従う 例:話し方, 形式 論理的/思考プロセスを必要とする 例:コード生成, 数学・科学計算 ジョブあたりの料金

    トークンあたりの料金 $0.00378 per 1K tokens for USE1-Nova2.0Lite 実行時間あたりの料金 $80.00 per hour for Nova2.0Lite-RFT-Training-Hours 利用可能なモデル Text: Nova 2 Lite, Nova Pro, Nova Micro Image: Titan Image Generator, Nova Canvas Embedding: Titan Multimodal Embeddings Text: Nova 2 Lite SFT vs RFT
  3. モデルカスタマイズの必要性 前提 • 汎⽤モデルのような全ユースケースで対応させる必要がない ◦ 特定のユースケースで回答精度を向上させる コスト‧レイテンシ • ⼊⼒トークンの削減が期待できる ◦

    コスト削減 ◦ 応答速度向上 • 汎⽤モデルよりもトークンあたりの料⾦が低単価 モデル 1kあたりの入力トークン料金 Nova 2.0 Lite オンデマンド推論 $0.0003 カスタマイズした場合でも Standard Tierと同じ Claude Sonnet 4.5 $0.003