Amazon Bedrock におけるモデルカスタマイズについて考えてみた

2025/12/23 クラウド事業本部コンサルティング部森⽥⼒ Amazon Bedrock におけるモデルカスタマイズについて考えてみた

⾃⼰紹介 • 所属 ◦ クラウド事業本部コンサルティング部 • 好きなサービス ◦ Amazon
Bedrock ◦ AWS Lambda • re:Invent ◦ 2回⽬の参加

AWS re:Invent 2025 - Dr. Swami Sivasubramanian

あれ、他にもなかったっけ？

Bedrockでのモデルカスタマイズ Supervised Fine-tuning（SFT） • re:Invent2023 で発表 Model Distillation • re:Invent2024
で発表

Supervised Fine-tuning（SFT）

Supervised ﬁne-tuning（SFT） Supervised ﬁne-tuning（SFT） • 事前学習済みの基盤モデルに対し、特定のタスクに特化したデータセットを⽤いて追加の学習 • モデルはデータセットに含まれる⾔語パターン、⽂体、フォーマット、および知識を模倣することを学習
• 「話し⽅」や「出⼒形式」を安定化したいユースケース • 特定のタスクに特化しすぎて、柔軟性を失う（過学習）可能性がある

Model Distillation

Model Distillation • 教師モデルの推論精度を可能な限り維持したまま重要な知識を⽣徒モデルへ知識を転送する → 教師モデルの精度を超えることは難しい • 推論速度向上, コスト削減が期待できる
• ⼤規模モデルのコストを抑えたいユースケース Model Distillation

Model Distillation 詳細は資料を公開しているのでご確認ください。 https://speakerdeck.com/ch6noota/xin-ji-neng-bedrock-model-distillation-ji-chu-shi-jian-made-number-regrowth-fukuoka

Reinforcement Fine-tuning

Reinforcement Fine-tuning （RFT） • 強化学習の仕組みを LLM の学習（Fine-tuning）に適⽤ ◦ SFTと⽐較すると複雑なワークフローでの学習 →
Bedrock を利⽤すれば、マネージドに学習可能 • 「より⾼い評価が得られる回答の作り⽅」を学習させることが可能 → 柔軟性を損ないにくく、新しい知識を得ることができる • 「形式の模倣」には不向き Reinforcement Fine-tuning （RFT）

Reinforcement Fine-tuning （RFT）詳細は資料を公開しているのでご確認ください。 https://speakerdeck.com/ch6noota/reinforcement-ﬁne-tuning-ji-chu-shi-jian-made

⽬的の違い

⽬的の違い⼩規模モデルを⼤規模モデルに近づける • Model Distillation ⼩規模モデルが新たな知識を獲得する • Supervised ﬁne-tuning（SFT） •
Reinforcement Fine-tuning （RFT）

SFT vs RFT

SFT RFT ユースケース厳格に知識に従う例：話し方, 形式論理的/思考プロセスを必要とする例：コード生成, 数学・科学計算ジョブあたりの料金
トークンあたりの料金 $0.00378 per 1K tokens for USE1-Nova2.0Lite 実行時間あたりの料金 $80.00 per hour for Nova2.0Lite-RFT-Training-Hours 利用可能なモデル Text: Nova 2 Lite, Nova Pro, Nova Micro Image: Titan Image Generator, Nova Canvas Embedding: Titan Multimodal Embeddings Text: Nova 2 Lite SFT vs RFT

モデルホスティング

モデルホスティングオンデマンド推論（2025/07より提供） • 利⽤したトークンあたりの料⾦（基盤モデルと同じ料⾦体系） • 数秒間のコールドスタートが発⽣する可能性がある • 未対応のモデルありプロビジョンドスループット •
コミットメント期間での料⾦ • 事前にコミットメントしたスループットを提供する

最後に：モデルカスタマイズの必要性

モデルカスタマイズの必要性前提 • 汎⽤モデルのような全ユースケースで対応させる必要がない ◦ 特定のユースケースで回答精度を向上させるコスト‧レイテンシ • ⼊⼒トークンの削減が期待できる ◦
コスト削減 ◦ 応答速度向上 • 汎⽤モデルよりもトークンあたりの料⾦が低単価モデル 1kあたりの入力トークン料金 Nova 2.0 Lite オンデマンド推論 $0.0003 カスタマイズした場合でも Standard Tierと同じ Claude Sonnet 4.5 $0.003

Amazon Bedrock におけるモデルカスタマイズについて考えてみた

Amazon Bedrock におけるモデルカスタマイズについて考えてみた

Morita

More Decks by Morita

Featured

Transcript

2025/12/23 クラウド事業本部コンサルティング部森⽥⼒ Amazon Bedrock におけるモデルカスタマイズについて考えてみた

⾃⼰紹介 • 所属 ◦ クラウド事業本部コンサルティング部 • 好きなサービス ◦ Amazon

AWS re:Invent 2025 - Dr. Swami Sivasubramanian

あれ、他にもなかったっけ？

Bedrockでのモデルカスタマイズ Supervised Fine-tuning（SFT） • re:Invent2023 で発表 Model Distillation • re:Invent2024

Supervised Fine-tuning（SFT）

Model Distillation

Model Distillation • 教師モデルの推論精度を可能な限り維持したまま重要な知識を⽣徒モデルへ知識を転送する → 教師モデルの精度を超えることは難しい • 推論速度向上, コスト削減が期待できる

Model Distillation 詳細は資料を公開しているのでご確認ください。 https://speakerdeck.com/ch6noota/xin-ji-neng-bedrock-model-distillation-ji-chu-shi-jian-made-number-regrowth-fukuoka

Reinforcement Fine-tuning

Reinforcement Fine-tuning （RFT） • 強化学習の仕組みを LLM の学習（Fine-tuning）に適⽤ ◦ SFTと⽐較すると複雑なワークフローでの学習 →

Reinforcement Fine-tuning （RFT）詳細は資料を公開しているのでご確認ください。 https://speakerdeck.com/ch6noota/reinforcement-ﬁne-tuning-ji-chu-shi-jian-made

⽬的の違い

⽬的の違い⼩規模モデルを⼤規模モデルに近づける • Model Distillation ⼩規模モデルが新たな知識を獲得する • Supervised ﬁne-tuning（SFT） •

SFT vs RFT

SFT RFT ユースケース厳格に知識に従う例：話し方, 形式論理的/思考プロセスを必要とする例：コード生成, 数学・科学計算ジョブあたりの料金

モデルホスティング

最後に：モデルカスタマイズの必要性

モデルカスタマイズの必要性前提 • 汎⽤モデルのような全ユースケースで対応させる必要がない ◦ 特定のユースケースで回答精度を向上させるコスト‧レイテンシ • ⼊⼒トークンの削減が期待できる ◦

Amazon Bedrock における モデルカスタマイズについて考えてみた

Amazon Bedrock における モデルカスタマイズについて考えてみた

More Decks by Morita

Featured

Transcript

Amazon Bedrock におけるモデルカスタマイズについて考えてみた

Amazon Bedrock におけるモデルカスタマイズについて考えてみた