20240711_RAGを用いたシンプルな 社内情報検索システムを導入した話とつらみ
by
shunta ichikawa
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
RAGを用いたシンプルな 社内情報検索システムを導入した話とつらみ Findy Lunch LT 「現場で実践!RAG活用術 Lunch LT ― 運用して分かった"つらみ"とその対策」
Slide 2
Slide 2 text
アジェンダ 1. 自己紹介 2. 導入の背景 3. RAGの概要 4. システムの構成 5. 導入・運用 6. つらみ
Slide 3
Slide 3 text
自己紹介 市川 俊太 いちかわ しゅんた (37歳) 株式会社助太刀 バックエンドエンジニア ● 猫が好き ● 趣味はサッカー観戦 ● Ruby/PHPなどのLL言語が好き
Slide 4
Slide 4 text
会社紹介 事業者間マッチング 協力会社探し 正社員採用 工事会社の人手不足を マッチングと 正社員採用で解決
Slide 5
Slide 5 text
アジェンダ 1. 自己紹介 2. 導入の背景 3. RAGの概要 4. システムの構成 5. 導入・運用 6. つらみ
Slide 6
Slide 6 text
導入の背景 ● 社内ルールや仕事上の資料がどこにあるか分からない(特に新入社員など) ● 管理部に都度業務ルール(タクシー利用の申請方法など)をSlackで質問 ● 偉い人「流行りのAIを使って何かシステムを構築してみては?」(つらみ?)
Slide 7
Slide 7 text
導入の背景 ● 弊社ではGoogleWorkspaceを利用 ● ドキュメント関連はGoogleDriveにて一元管理 ● GoogleDriveをソース元にしたRAGを利用した検索システムを構築する?🤔
Slide 8
Slide 8 text
● 情報検索基盤を開発していた2023年11月頃は、RAGに関する情報が今ほど多くなかっ た(つらみ) ● AWS主催の生成AIイベントに参加 ○ Amazon Kendraを知る 導入の背景 Amazon KendraとLLMを活用した社内情報検索基盤を構築することにした
Slide 9
Slide 9 text
アジェンダ 1. 自己紹介 2. 導入の背景 3. RAGの概要 4. システムの構成 5. 導入・運用 6. つらみ
Slide 10
Slide 10 text
RAGの概要
Slide 11
Slide 11 text
アジェンダ 1. 自己紹介 2. 導入の背景 3. RAGの概要 4. システムの構成 5. 導入・運用 6. つらみ
Slide 12
Slide 12 text
システムの構成 ● AWS Cognitoのユーザプールに Google認証を統合 ● 社内ドキュメントはAmazon Kendraに インデックスを作成 ○ KendraからGoogleDrive連携が うまくいかず、S3をソース元に変 更(つらみ) ● メッセージはDynamoDBに格納 ● インフラはAWS上で構築 ● 検索画面となるフロントエンドは Vercel(Next.js)でホスティング
Slide 13
Slide 13 text
アジェンダ 1. 自己紹介 2. 導入の背景 3. RAGの概要 4. システムの構成 5. 導入・運用 6. つらみ
Slide 14
Slide 14 text
導入・運用 ● 社内約2/3の社員が利用(全社員170名ほど) ● 利用ピーク時、月約70件の質問に関するクエリが実行
Slide 15
Slide 15 text
導入・運用 ● 具体的な利用例 ○ 「Slack に外部の方を招待する方法を教えて」 ○ 「入籍したらどのような手続きが必要ですか?」 ○ 「休日出勤をするときの申請方法を教えて」 ○ 「内装業者のお客さんの更新提案、何に気をつければいいだろうか?」
Slide 16
Slide 16 text
導入・運用 ある程度使ってくれてそう🤔 ● 具体的な利用例 ○ 「Slack に外部の方を招待する方法を教えて」 ○ 「入籍したらどのような手続きが必要ですか?」 ○ 「休日出勤をするときの申請方法を教えて」 ○ 「内装業者のお客さんの更新提案、何に気をつければいいだろうか?」
Slide 17
Slide 17 text
システム利用に関するアンケート結果 利用者の声 「探したい資料をキーワード検索とかできると嬉しい。ドライ ブ検索だとあまりにも検索結果が多いため」 「マニュアル以外にも、個別事象の対応を蓄積させて回答で きるようになったら嬉しいです!」 未利用者の声 「知る機会がない。本件に限らず「slackで流せば全員に必 ず伝わる」ということがこの会社では散見される。」
Slide 18
Slide 18 text
アジェンダ 1. 自己紹介 2. 導入の背景 3. RAGの概要 4. システムの構成 5. 導入・運用 6. つらみ
Slide 19
Slide 19 text
つらみ ● 技術的なつらみ ● 運用のつらみ
Slide 20
Slide 20 text
つらみ ● 技術的なつらみ ○ 検索速度が遅い ○ 回答の精度が時々怪しい ■ ドキュメントの質に依存し、ハルシネーションは起きる ○ 評価が難しい ■ 検索結果の評価自体が難しい ● 悪い場合どこが悪いのか特定するのが難しい ■ RAGでは、検索と生成という2つの組み合わせのため評価が難しい
Slide 21
Slide 21 text
つらみ ● 運用のつらみ ○ そもそもRAGが何かわからず利用しているケースがある ■ ChatGPT, Google検索のように利用されている ○ ドキュメントの質に検索精度が左右される ○ ドキュメント自体ちゃんと管理する必要がある ■ 運用ルールを定める必要がある ■ 古い情報で回答が生成される
Slide 22
Slide 22 text
導入した感想 ○ やりたいことに対して、そもそもRAGを使う必要があったのか? ■ 全文検索エンジンだけで事足りるのでは? ○ 会社規模(利用頻度など)に見合ったシステムの構築が必要 ■ Amazon Kendra利用料が結構かかる(月約800ドル) ● 今だとVertex AI Search + LLM Add-on の方が安くすみそう
Slide 23
Slide 23 text
皆様、ご清聴ありがとうございました! Findyさんもありがとうございます! 助太刀くん (弊社のマスコット)