Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amazon Bedrockのバッチ推論が強化された件について

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for Yuto Sato Yuto Sato
August 29, 2025
57

Amazon Bedrockのバッチ推論が強化された件について

2025 Japan AWS Jr. Champions アップデート情報共有コミュニティ勉強会 2025/08/28実施分

Avatar for Yuto Sato

Yuto Sato

August 29, 2025
Tweet

More Decks by Yuto Sato

Transcript

  1. [ Introduction ] 佐藤 優音 Sato Yuto    製造事業グループ    ソリューション第一事業本部    コンサルティング第三部第三課

    所属    吹奏楽(打楽器・ドラム)、    コーヒー、AWS BuildrCards 趣味    OracleのSaaSERPパッケージの導入 業務
  2. 01 非同期実行 APIをコールしてジョブを作成→即座にジョブIDが返却 処理はバックグラウンドで実行される!→待ちなしでOK 02 スループット最適化 AWSが裏側でコンピューティングリソースのスケーリングや リクエストのキューイングを管理→効率◎ 03 データ入出力の疎結合

    データソースと出力先としてAmazon S3を利用 →推論処理と前後のデータ処理パイプラインを完全に分離 04 ステート管理 各ジョブに InProgress, Completed, Failed などのステータス →AWSコンソールやCLI/SDKを通じて追跡可 Batch Inferenceとは?
  3. 高度な読解力と論理的思考 マルチリンガル性能 コスト面での負担× オーバースペックの可能性 Anthropic Claude Sonnet 4 一言でいえば、 「品質重視のバッチ処理」

    。 契約書や論文のように、アウトプットの 正確性や論理性がビジネス上の価値に 直結するような、難易度の高いタスクを大 量に処理したい場合にぴったり! これまで人手でのレビューが必須だった り、高コストな同期APIを何度も呼び出し たりしていたワークフローを、バッチ処理 に置き換えることで大幅に効率化! メ リ ッ ト ・ デ メ リ ッ ト
  4. 圧倒的なコスト効率 基本的な処理には十分な汎用性能 複雑なタスクへの対応力 品質のばらつき OpenAI GPT-OSS モデル 一言でいえば、 「量とコスト効率重視の バッチ処理」

    。その驚異的なコストパフォ ーマンスでこれまで費用対効果の観点から 諦めていたような、 「とにかく数が多い」 タスクに適用可能。 多少の精度よりも、まずは大規模なデータ を捌ききることが優先されるデータクレン ジングや、単純なタグ付けといった用途で 真価を発揮。 メ リ ッ ト ・ デ メ リ ッ ト