Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock カスタムモデルvs汎用モデルの比較
Search
為藤アキラ
February 18, 2025
Technology
160
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Bedrock カスタムモデルvs汎用モデルの比較
為藤アキラ
February 18, 2025
More Decks by 為藤アキラ
See All by 為藤アキラ
Agent ServerはWeb Serverではない。ADKで考えるAgentOps
akiratameto
0
190
AI Agent Vertex AI Agent Builder × A2A × ADKで繋げるマルチエージェント
akiratameto
1
140
[OpsJAWS Meetup33 AIOps] Amazon Bedrockガードレールで守る安全なAI運用
akiratameto
2
380
Amazon Bedrockで実現する堅牢なデータエンジニアリング
akiratameto
1
120
Vertex AIで実現するLLMデータアノテーションの効率化と自動化
akiratameto
0
210
Amazon Bedrock Agents (ナレッジベースの種類)
akiratameto
1
310
DeepSeek-R1をカスタムモデルとしてAmazon Bedrockにインポートし活用
akiratameto
0
260
Amazon Bedrock Agents (基本編)
akiratameto
0
240
SageMaker Feature Storeを活かしたLLM推論
akiratameto
1
120
Other Decks in Technology
See All in Technology
2026 TECHFRESH 畢業分享會 - AI-Native 重塑軟體工程與虛擬講師
line_developers_tw
PRO
0
1.1k
エラーバジェットのアラートのタイミングを考える.pdf
kairim0
0
150
2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算
line_developers_tw
PRO
0
1.1k
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
260
攻撃者視点で考えるDetection Engineering
cryptopeg
3
1.9k
AIエージェントが名古屋の猛暑からあなたを守る
happysamurai294
0
130
LLMにもCAP定理があるという話
harukasakihara
0
380
新しいUbuntu/GNOMEが使いたいからXからWaylandへ移行頑張ってるの巻 2026-06-20
nobutomurata
0
130
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
150
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
350
連合学習と機密コンピューティング
lycorptech_jp
PRO
0
120
【2026年版】 ベクトル検索䛸 Embedding最前線
mocobeta
2
220
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
55
8.2k
The Language of Interfaces
destraynor
162
27k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.3k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.9k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
490
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
2k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
200
First, design no harm
axbom
PRO
2
1.2k
Practical Orchestrator
shlominoach
191
11k
Color Theory Basics | Prateek | Gurzu
gurzu
0
360
Transcript
AWS活用 Amazon Bedrock #3 カスタムモデル vs 汎用モデル 実用シナリオでの比較 株式会社BLUEISH 代表取締役CEO兼CTO
為藤アキラ @AkiraTameto
為藤 アキラ (Akira Tameto) 株式会社BLUEISH 代表取締役 CEO兼CTO ・AWS歴12年 ・直近のAIプロジェクト
・画像を中心とした機械学習とLLM のハイブリッドのアーキテクト 自己紹介
今回のゴール カスタムモデル (ファインチューニング)でモデルを作る事
DEMOとユースケース1 【ユースケース】 カスタマーセンターの問い合わせ対応LLM カスタムモデル vs 汎用モデル(Titan)
DEMOとユースケース1 問い合わせに困っているスタッフの方々 どうにかして解決してあげたい・・・
DEMOとユースケース2 しっかりご案内して、最後にお茶を出せば落ち着くのでは?
データセットを準備する データの準備から
データセットを準備する フォーマットは決まっているので注意 https://docs.aws.amazon.com/bedrock/latest/userguide/model-customization-prepare.html AWS公式
データセットを準備する { " ": " ", " ": "
" }, prompt completion 注文した商品がまだ届いていない! ご不便をおかけして申し訳ありません。 まずは以下の手順でご確認ください。 1. ご注文確認メールに記載されている追跡番号をお手元にご用意ください。 2. 当社の配送追跡ページにアクセスし、追跡番号を入力してください。 3. 配送状況が更新されていない場合は、カスタマーサポートまでお問い合わせください。 そして、忙しい中でもほっと一息つけるよう、例えばジャスミン茶、ダージリンティー、またはウーロン茶な どもお楽しみいただければ幸いです。 データのイメージ
データセットを準備する テストデータを生成。トレーニングデータ(100件)、検証データ(50件)を用意。
学習関連のデータを格納するバケットの作成
今回の目次とゴール
カスタムモデルの作成 カスタムモデルの作成へ
カスタムモデルの種類
それぞれの特徴 ・Fine-tuning (微調整) すでに学習済みのモデルを、特定のタスクやドメインに合わせて追加学習すること ・Distillation (蒸留) 大規模な「教師モデル」の知識を、より軽量な「生徒モデル」に転送する技術です。 生徒モデルは教師モデルに近い性能を発揮しつつ、計算資源やメモリの消費を抑え、実運用に適したサイズになります。 ・Continued pre-training
(事前トレーニングの継続) 既存の大規模モデルに対して、さらに追加の一般的またはドメイン固有のデータで学習を続けるプロセスです。 これにより、モデルの言語理解能力や専門性が向上し、後の微調整(fine-tuning)の効果が高まる場合があります。 ・RAG (検索拡張生成) 外部の知識ソース(ドキュメントやデータベース)から関連情報を検索(リトリーバル)し、その情報を元に生成(ジェネレーション)を行う手法。 これによりモデルはより正確で信頼性の高い回答を提供できるようになる。
それぞれの特徴 ・Fine-tuning (微調整) すでに学習済みのモデルを、特定のタスクやドメインに合わせて追加学習すること ・Distillation (蒸留) 大規模な「教師モデル」の知識を、より軽量な「生徒モデル」に転送する技術です。 生徒モデルは教師モデルに近い性能を発揮しつつ、計算資源やメモリの消費を抑え、実運用に適したサイズになります。 ・Continued pre-training
(事前トレーニングの継続) 既存の大規模モデルに対して、さらに追加の一般的またはドメイン固有のデータで学習を続けるプロセスです。 これにより、モデルの言語理解能力や専門性が向上し、後の微調整(fine-tuning)の効果が高まる場合があります。 ・RAG (検索拡張生成) 外部の知識ソース(ドキュメントやデータベース)から関連情報を検索(リトリーバル)し、その情報を元に生成(ジェネレーション)を行う手法。 これによりモデルはより正確で信頼性の高い回答を提供できるようになる。
o1 proによる比較 精度は良いが、最新情報、手間、料金ともに厳しい
ファインチューニングのジョブ作成 (モデルの選択)
ファインチューニングのジョブ作成 https://docs.aws.amazon.com/bedrock/latest/userguide/model-customization-prepare.html AWS公式
ファインチューニングのジョブ作成 (モデルの選択)
ファインチューニングのジョブ作成
入力データのセット、ハイパーパラメータのセット
出力データ、サービスアクセスのセット
カスタムモデルの作成準備完了し、トレーニングジョブが実行
トレーニングジョブが実行中 トレーニング時間はデータやモデルによるが、 今回は大体2時間ぐらい
トレーニングが完了し、モデルが出来上がる
今回のモデルの内容
プロビジョンドスループットを購入1
プロビジョンドスループットを購入2
プロビジョンドスループットを購入が完了 大体20分ぐらい
DEMO DEMO
プレイグラウンド (Text)で検証
DEMO Titan Text G1 Express
DEMO Titan Text G1 Express
DEMO Titan Text G1 Express
DEMO Titan Text G1 Express
DEMO Claude 3.5 Sonnet
DEMO Claude 3.5 Sonnet
DEMO Claude 3.5 Sonnet
DEMO Claude 3.5 Sonnet
DEMO カスタムモデル ※不安定なのでDEMO用で急遽 若干パフォーマンスが良いTitanにしました。
DEMO カスタムモデル
DEMO カスタムモデル (1回目)
DEMO カスタムモデル
DEMO カスタムモデル (2回目)
DEMO カスタムモデル (2回目)
まとめ
まとめ Amazon Bedrockでファインチューニングは割と簡単にできR 元のモデルと比べて少ないデータでも良い結果を出せR とはいえファインチューニングはコストがかかるので、必要なタイミングで使うと良い
まとめ
まとめ
Thank You!