論文紹介-AutoHyde

HyDEの網羅性を上げる Auto-HyDE手法の提案 (2024/4/5投稿) 芸術工学府一年鈴木醇

ユーザレビューレビューDB ユーザのレビューに似たものタイトルがわからなかったタイトルの意味は理解できなかった
タイトルが意味不明結局タイトルはどう関連する? 通常のRAGだと 01 意味的に似ているものではなく説明が欲しい

HyDE手法 02 ユーザレビュー LLM タイトルがわからなかったタイトルは、ラストの... という意味
と思った。タイトルの意味は... という考えがしっくり。タイトルは文字通り... 仮説解説タイトルの意味は.... である。仮説的文書埋め込み(HyDE): 疑似的に文書を生成することによって、目的の文書を取得する解説文書

HyDEの課題 03 HyDE手法には限界がある疑似文書を生成するプロンプト依存が大きいユーザの入力クエリに対して一つのプロンプトは非現実的 DBの性質によって、スタイルやトーン、構造が一意でない場合、疑似文書を生成するプロンプトによって検索が偏る

AutoHyDE 04 HyDEの網羅性を上げるために、どのような疑似的文章を生成すればよいかを判別検索結果 TOP100 keyword含む文書群 (重要かも) TOP20 TOP21~100
検索クエリヒロがミカに恋した理由キーワード [”ヒロ”,”ミカ”,”恋”] キーワード抽出ベクトル類似度検索クラスタ１クラスタ2 クラスタ3 疑似文書1 疑似文書２疑似文書3 通常のRAG Auto-HyDE 類似度検索を信頼する数xn 20x5 =100 類似度検索で取得する文書

AutoHyDEへの所感 05 レビューは、HyDEの手法の課題で紹介されたスタイルやトーン、構造が一意でないという最たる例素のHyDEでは必要な、プロンプト調整の部分が自動化される多視点を取ってくるということに対してクリティカル(な気がする) 懸念点提案のみで精度評価がされていない応答は遅くなる

参考文献 https://note.com/ippei_suzuki_us/n/n94cea16ac02e https://towardsdatascience.com/autohyde-making-hyde- better-for-advanced-llm-rag-619e58cdbd8e

論文紹介-AutoHyde

論文紹介-AutoHyde

tomatolian

More Decks by tomatolian

Other Decks in Research

Featured

Transcript

HyDEの網羅性を上げる Auto-HyDE手法の提案 (2024/4/5投稿) 芸術工学府一年鈴木醇

ユーザレビューレビューDB ユーザのレビューに似たものタイトルがわからなかったタイトルの意味は理解できなかった

HyDE手法 02 ユーザレビュー LLM タイトルがわからなかったタイトルは、ラストの... という意味

AutoHyDE 04 HyDEの網羅性を上げるために、どのような疑似的文章を生成すればよいかを判別検索結果 TOP100 keyword含む文書群 (重要かも) TOP20 TOP21~100

参考文献 https://note.com/ippei_suzuki_us/n/n94cea16ac02e https://towardsdatascience.com/autohyde-making-hyde- better-for-advanced-llm-rag-619e58cdbd8e