Upgrade to Pro — share decks privately, control downloads, hide ads and more …

二刀流で切り開くRAG活用術

Fumina Chihama
June 06, 2024
260

 二刀流で切り開くRAG活用術

Fumina Chihama

June 06, 2024
Tweet

More Decks by Fumina Chihama

Transcript

  1. 25歳 株式会社PASSIONATE GENIUS CTO 趣味 パーティーを開くこと, 筋トレ, 女装 経歴 経歴

    明治大学卒 機械学習・自然言語処理(NLP)の研究 ゲームエンジニアとしてハイカジュゲームを開発 AI電話オペレーターnocall.aiを開発 〃 〃 卒業後現職に就任
  2. 例えば... Q: サーバレス モデルサービング のレーテンシーはどのぐらい? A: レーテンシーのオーバーヘッドはベストエフォートで100m秒以下です。 Q: モデル・レジストリが必要なのはなぜですか? A:

    MLflowtrackingが機械学習トレーニング・プロセスのエンドツーエンドの再現性を提 供するのと同じように、モデル・レジストリはデプロイプロセスの再現性とガバナンス を提供します。本番システムはミッションクリティカルなので、コンポーネントはACL で分離できるため、特定のユーザーしかが本番モデルを変更できません。バージョン管 理とCI/CDワークフロー統合は、モデルを本番環境にデプロイする際の重要な役割でも あります。 ベクトルでは下位に
  3. 2つのスコア融合方法 逆順位融合  Reciprocal Rank Fusion 順位に基づいた スコアの計算 順位がスコアに与える 影響の大きさ 文章の順位

    一般的には k=60 加重合計スコア それぞれのモデルがどの程度 スコアに影響するか決定 BM25スコアとベクトルスコアを 適切な比率で加重平均 ↓ ↓ ↓ 異なる特徴を持つ 検索手法の利点を統合可能
  4. OkapiBM25 FAISS text-embedding-3-large (OpenAI) ベクトル検索 キーワード検索 前提と評価指標 使用データセット 弊社の資料・170チャンク クエリとドキュメントが1対1で紐付いている

    回答が何番目に表示されているかを 加味した回答率 ユーザーにK個アイテムをおすすめし、 ユーザーの好きなアイテム群のうち 何個当てることができたかという割合 評価指標 MRR Recall
  5. Recall@1 Recall@5 Recall@10 MRR@5 MRR@10 vector 0.506 0.882 0.947 0.653

    0.661 keyword 0.500 0.900 0.953 0.655 0.662 RFF hybrid 0.553 0.929 0.971 0.707 0.713 weighted sum hybrid 0.606 0.953 0.988 0.738 0.742 結果
  6. Recall@1 Recall@5 Recall@10 MRR@5 MRR@10 vector rerank 0.712 0.965 0.988

    0.817 0.821 keyword rerank 0.712 0.965 0.988 0.817 0.823 RFF hybrid rerank 0.712 0.959 0.982 0.817 0.821 weighted sum hybrid rerank 0.712 0.959 0.982 0.817 0.821 ハイブリットで上がりにくい ベクトル検索・キーワード検索での精度改善が著しい 結果
  7. Recall@1 Recall@5 Recall@10 MRR@5 MRR@10 vector 0.722 0.839 0.879 0.768

    0.773 vector rerank 0.710 0.820 0.857 0.752 0.757 keyword 0.556 0.719 0.753 0.621 0.626 keyword rerank 0.685 0.765 0.790 0.717 0.721 hybrid 0.657 0.796 0.865 0.710 0.719 RFF hybrid rerank 0.733 0.858 0.881 0.781 0.784 weighted sum hybrid 0.731 0.836 - 0.773 - weighted sum hybrid rerank 0.733 0.858 - 0.781 - 結果 データセット:TyDiQA リランキングを挟むことで、一応数%ほどの向上
  8. 導入 業界 事例 Webサイト(nocall.ai)から資料請求で AI電話をご体験いただけます 活用事例① 〜架電業務を完全自動化〜 人間のような会話応答が可能なAI電話オペレーター 訓練・管理は不要、無限の記憶力を保持 365日24時間稼働

    人材 不動産 イベントなど リマインド電話の自動化 家賃滞納社への催促 SaaSオンボーディングのサポート インサイドセールス電話の自動化 イベント予定確認の自動化 など