Amazon Bedrockの最新モデル総まとめ2024

Amazon Bedrockの最新モデル総まとめ2024 AWS re:Invent 2024 re:cap LT大会(2024-12-17) ※この発表資料に含まれる意見や見解は、個人的なものであり、所属する組織や会社の公式な立場や意見を代表するものではありません。 2020-2024
Japan AWS Top Engineer (Services) 2020-2024 Japan AWS All Certifications Engineer 小西秀和 (Hidekazu Konishi)

1 |E| = 46, |W| = 44 |E ∪ W|
= 52, |M| = 122 |E ∪ W| + |M| = 174

2 |E| = 46, |W| = 44 |E ∪ W|
= 52, |M| = 122 |E ∪ W| + |M| = 174 Bedrock Marketplace Serverless Total Serverless (us-east-1) Serverless (us-west-2) Serverless Bedrock Marketplace Number of Models (as of 2024-12-16)

3 Amazon BedrockのServerlessモデル一覧：リージョン別(2024-12-16現在) ◼ プロバイダ別モデルタイプ別モデル一覧(N. Virginia[us-east-1]とOregon[us-west-2]をマージしたもの) ※斜体(赤茶色)はN. Virginia[us-east-1]のみ利用可能なモデル ※下線(青色)はOregon[us-west-2]のみ利用可能なモデルプロバイダ
モダリティモデル名 AI21 Labs Text Jurassic-2[Ultra, Mid], Jamba 1.5[Mini, Large], Jamba-Instruct Amazon Text Nova Micro, Titan Text G1[Lite, Express, Premier], Rerank 1.0 Text & Vision Nova[Pro, Lite] Image Nova Canvas, Titan Image Generator G1[v1, v2] Video Nova Reel Embeddings Titan Multimodal Embeddings G1, Titan Text Embeddings V2, Titan Embeddings G1 – Text Anthropic Text Claude 3.5[Haiku], Claude[v2.1, v2.0], Claude Instant[v1.2] Text & Vision Claude 3.5[Sonnet v2, Sonnet], Claude 3[Haiku, Sonnet, Opus] Cohere Text Command R+, Command R, Command, Command Light, Rerank 3.5 Embeddings Embed Multilingual, Embed English Meta Text Llama 3.2[1B Instruct, 3B Instruct], Llama 3.1[8B Instruct, 70B Instruct, 405B Instruct], Llama 3[8B Instruct, 70B Instruct] Text & Vision Llama 3.2[90B Vision Instruct, 11B Vision Instruct] Mistral AI Text Mistral Large 2, Mistral Large, Mistral Small, Mixtral 8x7B Instruct, Mistral 7B Instruct Stability AI Image SD3 Large 1.0, Stable Image Core 1.0, Stable Image Ultra 1.0, SDXL(1.0)

4 Amazon BedrockのServerlessモデル一覧：提供時期別(2024-12-16現在) ◼ プロバイダ別モデルタイプ別モデル一覧(N. Virginia[us-east-1]とOregon[us-west-2]をマージしたもの) ※斜体(緑色)は2024年1月～AWS re:Invent 2024前に利用可能になったモデル ※下線(橙色)はAWS
re:Invent 2024で利用可能になったモデルプロバイダモダリティモデル名 AI21 Labs Text Jurassic-2[Ultra, Mid], Jamba 1.5[Mini, Large], Jamba-Instruct Amazon Text Nova Micro, Titan Text G1[Lite, Express, Premier], Rerank 1.0 Text & Vision Nova[Pro, Lite] Image Nova Canvas, Titan Image Generator G1[v1, v2] Video Nova Reel Embeddings Titan Multimodal Embeddings G1, Titan Text Embeddings V2, Titan Embeddings G1 – Text Anthropic Text Claude 3.5[Haiku], Claude[v2.1, v2.0], Claude Instant[v1.2] Text & Vision Claude 3.5[Sonnet v2, Sonnet], Claude 3[Haiku, Sonnet, Opus] Cohere Text Command R+, Command R, Command, Command Light, Rerank 3.5 Embeddings Embed Multilingual, Embed English Meta Text Llama 3.2[1B Instruct, 3B Instruct], Llama 3.1[8B Instruct, 70B Instruct, 405B Instruct], Llama 3[8B Instruct, 70B Instruct] Text & Vision Llama 3.2[90B Vision Instruct, 11B Vision Instruct] Mistral AI Text Mistral Large 2, Mistral Large, Mistral Small, Mixtral 8x7B Instruct, Mistral 7B Instruct Stability AI Image SD3 Large 1.0, Stable Image Core 1.0, Stable Image Ultra 1.0, SDXL(1.0)

5 AWS re:Invent 2024で発表されたServerlessモデル(現在利用可能) ◼ プロバイダ別モデルタイプ別モデル一覧(N. Virginia[us-east-1]とOregon[us-west-2]をマージしたもの) ※斜体(赤茶色)はN. Virginia[us-east-1]のみ利用可能なモデル ※下線(青色)はOregon[us-west-2]のみ利用可能なモデル
プロバイダモダリティモデル名概要 Cohere Text Rerank 3.5 RAGアプリケーションの検索精度を向上させるためのモデル。ユーザークエリと検索された文書群を入力とし、関連性に基づいて再ランク付けを行い、モデル入力として最適な文書を優先的に選択することで、生成応答の質を向上させる。 Amazon Text Rerank 1.0 Text Nova Micro 最小限のレイテンシーで高速処理が可能なテキスト専用モデル。128Kトークンの文脈長で、要約・翻訳・分類・対話・コーディングなどの基本タスクに最適化。ファインチューニングに対応。 Text & Vision Nova Lite 高速な処理が可能な低コストのマルチモーダルモデル。画像・動画・テキストの入力から文章を生成。300Kトークンまでの入力と複数画像・30分までの動画分析が可能。ファインチューニングに対応。 Text & Vision Nova Pro 精度・速度・コストのバランスに優れた高性能マルチモーダルモデル。300Kトークンまでの入力に対応し、視覚的質問応答や動画理解で最高水準の性能を実現。APIやツール連携による複雑なワークフローの実行が可能。ファインチューニングに対応。 Image Nova Canvas 高品質な画像生成が可能な最先端モデル。スタイルやコンテンツの精密な制御、インペイント(部分修正)、アウトペイント(画像拡張)や背景除去などの編集機能を搭載。画像生成の忠実性評価で高いパフォーマンスを実現。 Video Nova Reel プロフェッショナル品質の動画生成が可能な最先端モデル。テキストや画像からの動画生成、視覚的スタイルやペースの制御が可能。動画の品質と一貫性において優れたパフォーマンスを発揮。

6 AWS re:Invent 2024で発表されたServerlessモデル(近日公開予定) プロバイダモダリティモデル名概要 Amazon Text
& Vision Nova Premier 複雑な推論タスク向けの最上位マルチモーダルモデル。カスタムモデルの知識蒸留(大規模モデルから小規模モデルへの確率分布と中間層の潜在表現を知識転移)のための教師モデルとしても最適。2025年初頭リリース予定。 poolside Text malibu コード生成、テスト作成、リファクタリング、ドキュメント作成といった高度なタスクなど複雑なソフトウェアエンジニアリングの課題に特化したモデル。アシスタントと連携することで、開発者のIDE内で直接利用でき、ナレッジベースに基づいてファインチューニングされ、組織固有のニーズに応える柔軟性がある。 Text point 高度なコンテキスト認識を活用して開発者のニーズを正確に予測する迅速なコード補完に特化したモデル。アシスタントと連携することで、開発者のIDE内で直接利用でき、ナレッジベースに基づいてファインチューニングされ、組織固有のニーズに応える柔軟性がある。 Stability AI Image Stable Diffusion 3.5 Large Stability AIが提供する最新の高性能画像生成モデル。テキストから高品質で美しい画像を生成可能。コンセプトアート制作やビジュアルエフェクト、詳細な商品画像の作成を効率化。 Luma AI Video Ray 2 テキストや画像プロンプトから10秒程度で高品質な動画を生成できる最新の動画生成モデル。滑らかな動き、高度な撮影技法、ダイナミックなカメラワークを実現し、最大 1分間の映像を作成可能。

7 Amazon BedrockのMarketplaceモデル一覧(2024-12-16現在) プロバイダカテゴリモデル名 HuggingFace Text Generation, Text
Summarization, Automatic Speech Recognition等モデル数：83種類。主要シリーズ：BART, Bloom, DBRX, Dolly, EleutherAI GPT, Falcon, Flan-T5, Gemma, Mistral, MPT, Phi, Yi, Zephyrなど Arcee AI Text Generation Arcee[Lite, Nova, SuperNova], Llama Spark, Llama 3.1 SuperNova Lite Camb.ai Text To Audio MARS6 EvolutionaryScale, PBC Multimodal Generation ESM3-open Gretel Text Generation Gretel Navigator Tabular IBM Data and AI Text Generation IBM Granite[8B Code Instruct - 128K, 3B Code Instruct - 128K, 34B Code Instruct - 8K, 20B Code Instruct - 8K], Granite 3.0[8B Instruct, 2B Instruct] John Snow Labs Text Summarization Medical LLM[Small, Medium] Translation Medical Text Translation (EN-ES) Karakuri, Inc. Text Generation KARAKURI LM 8x7b instruct LG CNS Text Generation EXAONE_v3.0 7.8B Instruct Liquidai Text Generation Liquid LFM[40B (L40S), 40B (H100), 40B (A100)] NCSoft Text Generation Llama-3-Varco-Offsetbias-8B, VARCO LLM KO/EN-13B-IST NVIDIA Text Generation NVIDIA Nemotron-4 15B NIM Microservice Preferred Networks, Inc. Text Generation PLaMo API Stability AI Text To Image Stable Diffusion 3.5 Large Stockmark Inc. Text Generation Stockmark-LLM-13b Upstage Text Generation Solar[Pro, Pro – Quant], Solar Mini[Chat, Chat – Quant, Chat ja, Chat ja – Quant] Widn.AI Translation Widn Tower Sugarloaf, Widn Tower Anthill, Widn Llama3-Tower Vesuvius Writer Text Generation Writer Palmyra-Med-70B-32K, Writer Palmyra-Fin-70B-32K

8 ◼ AWS re:Invent 2024のAmazon Bedrock全体の発表を振り返ると Amazon Bedrockが目指しているものとは(私見) ◆RAG（検索拡張生成）機能の強化・RerankモデルとAPI導入による検索最適化
・ストリーミング出力によるユーザー体験向上・カスタムコネクタとストリーミング取込の実装・GraphRAGやKendra GenAIインデックスとの連携 ◆マルチモーダル対応の拡充・Novaシリーズによる様々なモデル提供 (テキスト、画像、ビデオ、音声) ・ナレッジベースのマルチモーダルデータ取込・画像に対する毒性検出機能 ◆モデル最適化とパフォーマンス向上・レイテンシー最適化オプションの導入・モデル蒸留機能の実装・プロンプトキャッシュ対応・プロンプトルーティング機能 ◆エコシステムの拡大・Bedrockマーケットプレイスの導入・新規モデルプロバイダーの追加・サードパーティ製モデルの統合 ◆品質管理・評価機能の強化・LLM-as-a-judgeによるモデル評価・ナレッジベースの評価機能・ガードレールの機能拡張・自動推論チェックの導入 ◆自動化・効率化の推進・データオートメーション機能の導入・構造化データのクエリー対応・マルチエージェントのコラボレーション機能・エンタープライズ利用を想定した信頼性・安全性の向上・Bedrock利用システム全体のパフォーマンスと効率性の向上・ユーザーや開発者体験の改善と導入障壁の低下・より幅広いユースケースへの対応

9 ◼ AWS re:Invent 2024のAmazon Bedrock全体の発表を振り返ると Amazon Bedrockが目指しているものとは(私見) ◆RAG（検索拡張生成）機能の強化・RerankモデルとAPI導入による検索最適化
・ストリーミング出力によるユーザー体験向上・カスタムコネクタとストリーミング取込の実装・GraphRAGやKendra GenAIインデックスとの連携 ◆マルチモーダル対応の拡充・Novaシリーズによる様々なモデル提供 (テキスト、画像、ビデオ、音声) ・ナレッジベースのマルチモーダルデータ取込・画像に対する毒性検出機能 ◆モデル最適化とパフォーマンス向上・レイテンシー最適化オプションの導入・モデル蒸留機能の実装・プロンプトキャッシュ対応・プロンプトルーティング機能 ◆エコシステムの拡大・Bedrockマーケットプレイスの導入・新規モデルプロバイダーの追加・サードパーティ製モデルの統合 ◆品質管理・評価機能の強化・LLM-as-a-judgeによるモデル評価・ナレッジベースの評価機能・ガードレールの機能拡張・自動推論チェックの導入 ◆自動化・効率化の推進・データオートメーション機能の導入・構造化データのクエリー対応・マルチエージェントのコラボレーション機能・エンタープライズ利用を想定した信頼性・安全性の向上・Bedrock利用システム全体のパフォーマンスと効率性の向上・ユーザーや開発者体験の改善と導入障壁の低下・より幅広いユースケースへの対応 ※赤枠：モデルに関する発表

10 まとめ ◼ AWS re:Invent 2024のAmazon Bedrock全体として ⚫ エンタープライズ利用を想定した信頼性・安全性の向上 ⚫
Bedrock利用システム全体のパフォーマンスと効率性の向上 ⚫ ユーザーや開発者体験の改善と導入障壁の低下 ⚫ より幅広いユースケースへの対応 ◼ Amazon Bedrockのモデルにフォーカスすると ⚫ Amazon Novaシリーズの追加によってマルチモーダル含め、Amazonの独自AIモデルが強化された ⚫ Rerankモデル(Amazon Rerank, Cohere Rerank)の追加によってRAG検索精度を向上できるようになった ⚫ Amazon Bedrock Marketplaceの登場によってさらに豊富なモデルが利用可能 Amazon Bedrockの機能追加、モデルの追加や廃止のサイクルが早い。このことを考慮した、キャッチアップやシステム構築がポイントになってくる。特に運用フェーズに入っている場合は、現在使用しているモデルの代替えを想定して、常に試行して最新モデルを把握していく必要がある。

Amazon Bedrockの最新モデル総まとめ2024

Amazon Bedrockの最新モデル総まとめ2024

Hidekazu Konishi

More Decks by Hidekazu Konishi

Other Decks in Technology

Featured

Transcript

Amazon Bedrockの最新モデル総まとめ2024 AWS re:Invent 2024 re:cap LT大会(2024-12-17) ※この発表資料に含まれる意見や見解は、個人的なものであり、所属する組織や会社の公式な立場や意見を代表するものではありません。 2020-2024

1 |E| = 46, |W| = 44 |E ∪ W|

2 |E| = 46, |W| = 44 |E ∪ W|

6 AWS re:Invent 2024で発表されたServerlessモデル(近日公開予定) プロバイダモダリティモデル名概要 Amazon Text

7 Amazon BedrockのMarketplaceモデル一覧(2024-12-16現在) プロバイダカテゴリモデル名 HuggingFace Text Generation, Text

8 ◼ AWS re:Invent 2024のAmazon Bedrock全体の発表を振り返ると Amazon Bedrockが目指しているものとは(私見) ◆RAG（検索拡張生成）機能の強化・RerankモデルとAPI導入による検索最適化

9 ◼ AWS re:Invent 2024のAmazon Bedrock全体の発表を振り返ると Amazon Bedrockが目指しているものとは(私見) ◆RAG（検索拡張生成）機能の強化・RerankモデルとAPI導入による検索最適化

10 まとめ ◼ AWS re:Invent 2024のAmazon Bedrock全体として ⚫ エンタープライズ利用を想定した信頼性・安全性の向上 ⚫