Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amazon Bedrockのバッチ推論が強化された件について

Avatar for Yuto Sato Yuto Sato
August 29, 2025
2

Amazon Bedrockのバッチ推論が強化された件について

2025 Japan AWS Jr. Champions アップデート情報共有コミュニティ勉強会 2025/08/28実施分

Avatar for Yuto Sato

Yuto Sato

August 29, 2025
Tweet

Transcript

  1. [ Introduction ] 佐藤 優音 Sato Yuto    製造事業グループ    ソリューション第一事業本部    コンサルティング第三部第三課

    所属    吹奏楽(打楽器・ドラム)、    コーヒー、AWS BuildrCards 趣味    OracleのSaaSERPパッケージの導入 業務
  2. 01 非同期実行 APIをコールしてジョブを作成→即座にジョブIDが返却 処理はバックグラウンドで実行される!→待ちなしでOK 02 スループット最適化 AWSが裏側でコンピューティングリソースのスケーリングや リクエストのキューイングを管理→効率◎ 03 データ入出力の疎結合

    データソースと出力先としてAmazon S3を利用 →推論処理と前後のデータ処理パイプラインを完全に分離 04 ステート管理 各ジョブに InProgress, Completed, Failed などのステータス →AWSコンソールやCLI/SDKを通じて追跡可 Batch Inferenceとは?
  3. 高度な読解力と論理的思考 マルチリンガル性能 コスト面での負担× オーバースペックの可能性 Anthropic Claude Sonnet 4 一言でいえば、 「品質重視のバッチ処理」

    。 契約書や論文のように、アウトプットの 正確性や論理性がビジネス上の価値に 直結するような、難易度の高いタスクを大 量に処理したい場合にぴったり! これまで人手でのレビューが必須だった り、高コストな同期APIを何度も呼び出し たりしていたワークフローを、バッチ処理 に置き換えることで大幅に効率化! メ リ ッ ト ・ デ メ リ ッ ト
  4. 圧倒的なコスト効率 基本的な処理には十分な汎用性能 複雑なタスクへの対応力 品質のばらつき OpenAI GPT-OSS モデル 一言でいえば、 「量とコスト効率重視の バッチ処理」

    。その驚異的なコストパフォ ーマンスでこれまで費用対効果の観点から 諦めていたような、 「とにかく数が多い」 タスクに適用可能。 多少の精度よりも、まずは大規模なデータ を捌ききることが優先されるデータクレン ジングや、単純なタグ付けといった用途で 真価を発揮。 メ リ ッ ト ・ デ メ リ ッ ト