Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amazon Bedrock Knowledge Basesのアップデート紹介

そのだ
December 09, 2024
230

Amazon Bedrock Knowledge Basesのアップデート紹介

【connpass】
宇宙最速のBedrock Recap LT会(AWS re:Invent 2024)
https://jawsug.connpass.com/event/337666/

そのだ

December 09, 2024
Tweet

Transcript

  1. ©Fusic Co., Ltd. 2 苑田 朝彰 Sonoda Tomotada - X:

    sonoda_mj - 2023 AWS Jr.Champions - 2024 AWS Community Builders (ML & GenAI) - 2024 Japan AWS Top Engineers (Services) - 甲賀流忍者検定(初級) コメント 髪が青くなりました。 自己紹介 はじめに 株式会社Fusic
  2. ©Fusic Co., Ltd. 3 CONTENTS 目次 1. 背景 2. Amazon

    Bedrock Data Automation(BDA)とは 3. BDAをKnowledge Basesで使ってみる 4. 自動生成クエリフィルターとは 5. まとめ
  3. ©Fusic Co., Ltd. 5 Amazon Bedrock Knowledge Basesのアップデート一覧 • カスタム

    データソースに接続できるようになった • ドキュメントの変更を 1 つのステップで直接KBに取り込むことができるようになった • リランカー モデルを使用して、再ランク付けできるようになった • Amazon Bedrock ナレッジベースのユーザークエリとメタデータスキーマに基づいて、自動で フィルターを適用できるようになった • ストリーミングレスポンス対応 • データソースから結果を取得するときにガードレールを適用できるようになった • Amazon Bedrock Data Automation パーサーまたは Amazon Bedrock ナレッジベースの基盤モデル を使用して、画像を含むマルチモーダルデータを解析できるようになった • ナレッジベースを構造化データストアに接続し、KBで SQL クエリを生成できるようになった • GraphRAGに対応した • KBのデータソースとしてKendra GenAI Indexが選択できるようになった • Aurora Serverlessがクイック作成に対応した 引用:https://docs.aws.amazon.com/bedrock/latest/userguide/doc-history.html
  4. ©Fusic Co., Ltd. 6 Amazon Bedrock Knowledge Basesのアップデート一覧 • カスタム

    データソースに接続できるようになった • ドキュメントの変更を 1 つのステップで直接KBに取り込むことができるようになった • リランカー モデルを使用して、再ランク付けできるようになった • Amazon Bedrock ナレッジベースのユーザークエリとメタデータスキーマに基づいて、自動で フィルターを適用できるようになった • ストリーミングレスポンス対応 • データソースから結果を取得するときにガードレールを適用できるようになった • Amazon Bedrock Data Automation パーサーまたは Amazon Bedrock ナレッジベースの基盤モデル を使用して、画像を含むマルチモーダルデータを解析できるようになった • ナレッジベースを構造化データストアに接続し、KBで SQL クエリを生成できるようになった • GraphRAGに対応した • KBのデータソースとしてKendra GenAI Indexが選択できるようになった • Aurora Serverlessがクイック作成に対応した 引用:https://docs.aws.amazon.com/bedrock/latest/userguide/doc-history.html
  5. ©Fusic Co., Ltd. 8 Amazon Bedrock Data Automation (以下BDA)は、ドキュメント、画像、音声、動画などの非構造化マルチモーダルコンテ ンツからデータを抽出することができる。

    Amazon Bedrock Data Automationとは Amazon Bedrock Data Automation 免許証 output.md 名前:田中太郎 免許番号:123456789 住所:hogehoge 選択できる項目(翻訳済み)
  6. ©Fusic Co., Ltd. 18 BDAとFoundation Modelの使い分け 使いやすさ BDA:プロンプトのチューニング不可 Foundation model:プロンプトのチューニングが可能

    BDA:1ページあたり0.010USD Foundation model : • Claude3.5 Sonnet (v1) • 入力1000Tokenあたり0.003 USD • 出力1000Tokenあたり0.015 USD • Claude3 Haiku • 入力1000Tokenあたり0.00025 USD • 出力1000Tokenあたり0.00125 USD 値段
  7. ©Fusic Co., Ltd. 22 データはそのだが過去に発表した登壇資料(CDK Pipeline, Snowflake) 実際にやってみる { "content":

    { “text”: CDKに関するhogehoge }, "location": { "s3Location": { “uri”: “s3://Bucket名t/input/CDKPipeline.pdf" }, "type": "S3" }, "metadata": { “x-amz-bedrock-kb-source-uri”: “s3://バケット名/input/CDKPipeline.pdf", "category": "CDK", "x-amz-bedrock-kb-chunk-id": ”id", "x-amz-bedrock-kb-data-source-id": ”id" }, "score": 0.59251016 }, { "content": { “text”: Snowflakeに関するhogehoge }, "location": { "s3Location": { “uri”: “s3://Bucket名t/input/ Snowflaka.pdf" }, "type": "S3" }, "metadata": { “x-amz-bedrock-kb-source-uri”: “s3://バケット名/input/Snowflaka.pdf", "category": ”Snowflake", "x-amz-bedrock-kb-chunk-id": ”id", "x-amz-bedrock-kb-data-source-id": ”id" }, "score": 0.39254022 }, CDKに関する発表 Snowflakeに関する発表
  8. ©Fusic Co., Ltd. 24 手動で複雑なフィルターを作成する必要なく、検索結果を絞り込むことができる。 現在使用できるのはClaude3.5 Sonnetのみ 自動生成クエリフィルターとは 例)ワシントンで請求を行う場合 User

    Amazon Bedrock Knowledge Bases 質問 フィルター適応 回答 User Amazon Bedrock Knowledge Bases 質問 回答 Claudeが自動でフィルターを 作成し、適応する 従来の方法 自動フィルタリング 引用:https://docs.aws.amazon.com/bedrock/latest/userguide/kb-test-config.html
  9. ©Fusic Co., Ltd. 25 データはそのだが過去に発表した登壇資料(CDK Pipeline, Snowflake) そのまま検索すると両方のカテゴリから取得される 実際にやってみる {

    "content": { “text”: CDKに関するhogehoge }, "location": { "s3Location": { “uri”: “s3://Bucket名t/input/CDKPipeline.pdf" }, "type": "S3" }, "metadata": { “x-amz-bedrock-kb-source-uri”: “s3://バケット名/input/CDKPipeline.pdf", "category": "CDK", "x-amz-bedrock-kb-chunk-id": ”id", "x-amz-bedrock-kb-data-source-id": ”id" }, "score": 0.59251016 }, { "content": { “text”: Snowflakeに関するhogehoge }, "location": { "s3Location": { “uri”: “s3://Bucket名t/input/ Snowflaka.pdf" }, "type": "S3" }, "metadata": { “x-amz-bedrock-kb-source-uri”: “s3://バケット名/input/Snowflaka.pdf", "category": ”Snowflake", "x-amz-bedrock-kb-chunk-id": ”id", "x-amz-bedrock-kb-data-source-id": ”id" }, "score": 0.39254022 }, CDKに関する発表 Snowflakeに関する発表
  10. ©Fusic Co., Ltd. 26 実際にやってみる { "content": {}, "location": {

    "s3Location": { "uri": "s3://kendra-datasource-sonoda-test/input/CDKPipeline.pdf" }, "type": "S3" }, "metadata": { “x-amz-bedrock-kb-source-uri”: “s3://バケット名/input/CDKPipeline.pdf", “x-amz-bedrock-kb-description”: ”画像の詳細” "category": "CDK", “x-amz-bedrock-kb-byte-content-source”: “s3://バケット名/aws/bedrock/knowledge_bases/KBの ID/DatasourceのID/ファイル名”, “x-amz-bedrock-kb-data-source-id”: ”DatasourceのID" }, "score": 0.6175348 }, ・ ・ ・ categoryがCDKの検索結果