Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Bedrock RAG Evaluationを活用した RAGの定量的評価方法の紹介

Yodeee
December 05, 2024

Bedrock RAG Evaluationを活用した RAGの定量的評価方法の紹介

Yodeee

December 05, 2024
Tweet

More Decks by Yodeee

Other Decks in Technology

Transcript

  1. 依田 涼太 Ryota YODA • 金融系ソフトウェアを設計、開発 • 現在は米国シリコンバレーでAI等の 先端技術の調査・開発を担当 •

    re:Invent初参加 (ホテル間の距離を全く計算しておらず、い くつかのセッション聞き逃した) @YodeeeTech
  2. Step1: テストデータとしてJSONL形式で用意し、S3に格納 { "conversationTurns": [{ "prompt": { "content": [{ "text":

    "Calculate the year-over-year percentage change in cash and cash equivalents for Octank Financial from 2020 to 2021." }] }, "referenceResponses": [{ "content": [{ "text": "2020 cash and cash equivalents: $350 million, 2021 cash and cash equivalents: $480 million, Percentage change = (2021 value - 2020 value) / 2020 value * 100 = ($480 million - $350 million) / $350 million * 100 = 37.14% increase" }] }] }] } プロンプト文 正解文