Upgrade to Pro — share decks privately, control downloads, hide ads and more …

IR Reading 2024秋 論文紹介「MeMemo On-device Retrieva...

AITC - DENTSU SOKEN
November 10, 2024
460

IR Reading 2024秋 論文紹介「MeMemo On-device Retrieval Augmentation for Private and Personalized Text Generation」

AITC - DENTSU SOKEN

November 10, 2024
Tweet

More Decks by AITC - DENTSU SOKEN

Transcript

  1. SIGIR2024(Best Short Paper Award, Honorable Mention) MeMemo: On-device Retrieval Augmentation

    for Private and Personalized Text Generation Zijie J. Wang and Duen Horng Chau ( Georgia Institute of Technology , Atlanta, Georgia, USA) 株式会社電通総研 X(クロス)イノベーション本部 テクノロジー&イノベーションユニット AIトランスフォーメーションセンター 村本 直樹 IR Reading 2024 秋
  2. クライアントサイド MeMemoが実現したこと HNSWによる文書検索の仕組みを データ管理も含めクライアントサイドで完結させた IndexedDBに ベクトルなどを保存 質問内容 LlamaやPhiなどの ローカルで動くLLM 回答

    RAMでキーと HNSWグラフを保持 関連 文書 エンベディング GTE-Smallなど HNSWによる検索 LLMやエンベディング部分は サーバサイドにすることも可能
  3. 6 用語の軽い説明 ▍Hierarchical Navigable Small World(HNSW) ⚫ 高次元空間での近似最近傍探索を高速に行うことを目的とするアルゴリズム ⚫ グラフベースのアプローチで、複数の階層(レベル)にわたるリンクを

    利用して効率的に探索を行う ⚫ ANN検索で最もよく使われるアルゴリズムの1つ ▍IndexedDB ⚫ ブラウザ内で利用でき、データの永続化可能なオブジェクト指向DB ⚫ オフライン環境でデータの読み書きが可能 ⚫ ストレージの上限やデータの破棄基準はブラウザに依存 ⚫ データ操作は非同期で行われ、トランザクションを使って整合性を保つ
  4. 8 サンプルアプリケーションも提供されている GitHub - poloclub/mememo: A JavaScript library that brings

    vector search and RAG to your browser! githubから飛べるサンプル環境は検索がうまく使えないので、 ローカルに落としてちょっと手を加えて触ってみました…
  5. 11 まとめ(個人的な感想) ▍エージェントなどLLMの活用の幅は広がっているが、 RAGの仕組みはよく使われており、気軽に試せるところがGood ⚫ DBや全文検索エンジンなどを裏側で持つのは実装、運用コスト的にも難しい ⚫ 外部との通信に関する問題がない点が気楽でよい ▍クライアント側の環境に大きく依存するので、 アプリケーションとして提供する場合は考慮事項が多い

    ⚫ エンベディングはバッチ処理的にしないとどうしても時間がかかるので、 大規模に保存する場合は事前に用意するほうが良い (論文上で説明されている内容では)公式64GBのRAMを持つMacBook上でChromeを使用し、 384次元ベクトルで100万ドキュメントをインデックス化するのに約94分を要する ⚫ 当然サーバサイドに比べると容量や計算資源の問題から制約が多い (ドキュメントやベクトル次元数の上限等)