Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20240711_RAGを用いたシンプルな 社内情報検索システムを導入した話とつらみ

shunta ichikawa
July 09, 2024
2k

20240711_RAGを用いたシンプルな 社内情報検索システムを導入した話とつらみ

shunta ichikawa

July 09, 2024
Tweet

Transcript

  1. システムの構成 • AWS Cognitoのユーザプールに Google認証を統合 • 社内ドキュメントはAmazon Kendraに インデックスを作成 ◦

    KendraからGoogleDrive連携が うまくいかず、S3をソース元に変 更(つらみ) • メッセージはDynamoDBに格納 • インフラはAWS上で構築 • 検索画面となるフロントエンドは Vercel(Next.js)でホスティング
  2. 導入・運用 ある程度使ってくれてそう🤔 • 具体的な利用例 ◦ 「Slack に外部の方を招待する方法を教えて」 ◦ 「入籍したらどのような手続きが必要ですか?」 ◦

    「休日出勤をするときの申請方法を教えて」 ◦ 「内装業者のお客さんの更新提案、何に気をつければいいだろうか?」
  3. つらみ • 技術的なつらみ ◦ 検索速度が遅い ◦ 回答の精度が時々怪しい ▪ ドキュメントの質に依存し、ハルシネーションは起きる ◦

    評価が難しい ▪ 検索結果の評価自体が難しい • 悪い場合どこが悪いのか特定するのが難しい ▪ RAGでは、検索と生成という2つの組み合わせのため評価が難しい
  4. つらみ • 運用のつらみ ◦ そもそもRAGが何かわからず利用しているケースがある ▪ ChatGPT, Google検索のように利用されている ◦ ドキュメントの質に検索精度が左右される

    ◦ ドキュメント自体ちゃんと管理する必要がある ▪ 運用ルールを定める必要がある ▪ 古い情報で回答が生成される