Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介-AutoHyde
Search
tomatolian
June 24, 2024
Research
0
24
論文紹介-AutoHyde
tomatolian
June 24, 2024
Tweet
Share
More Decks by tomatolian
See All by tomatolian
24時間AIハッカソン- HEAT
tomatolian
0
11
うみがめのスープを利用した学習アプリ - RSS ハッカソン
tomatolian
0
37
論文紹介 - Emotion Bench
tomatolian
0
12
Other Decks in Research
See All in Research
Weekly AI Agents News! 9月号 プロダクト/ニュースのアーカイブ
masatoto
2
130
尺度開発における質的研究アプローチ(自主企画シンポジウム7:認知行動療法における尺度開発のこれから)
litalicolab
0
330
クラウドソーシングによる学習データ作成と品質管理(セキュリティキャンプ2024全国大会D2講義資料)
takumi1001
0
280
ミニ四駆AI用制御装置の事例紹介
aks3g
0
160
20240918 交通くまもとーく 未来の鉄道網編(太田恒平)
trafficbrain
0
210
メールからの名刺情報抽出におけるLLM活用 / Use of LLM in extracting business card information from e-mails
sansan_randd
2
130
言語と数理の交差点:テキストの埋め込みと構造のモデル化 (IBIS 2024 チュートリアル)
yukiar
3
670
さんかくのテスト.pdf
sankaku0724
0
320
文書画像のデータ化における VLM活用 / Use of VLM in document image data conversion
sansan_randd
2
180
Matching 2D Images in 3D: Metric Relative Pose from Metric Correspondences
sgk
1
310
[CV勉強会@関東 CVPR2024] Visual Layout Composer: Image-Vector Dual Diffusion Model for Design Layout Generation / kantocv 61th CVPR 2024
shunk031
1
440
SNLP2024:Planning Like Human: A Dual-process Framework for Dialogue Planning
yukizenimoto
1
320
Featured
See All Featured
Building Flexible Design Systems
yeseniaperezcruz
327
38k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
7
570
RailsConf 2023
tenderlove
29
900
Statistics for Hackers
jakevdp
796
220k
Code Reviewing Like a Champion
maltzj
520
39k
Building Better People: How to give real-time feedback that sticks.
wjessup
364
19k
How to train your dragon (web standard)
notwaldorf
88
5.7k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
131
33k
Unsuck your backbone
ammeep
668
57k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
16
2.1k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Making the Leap to Tech Lead
cromwellryan
133
8.9k
Transcript
HyDEの網羅性を上げる Auto-HyDE手法の提案 (2024/4/5投稿) 芸術工学府一年 鈴木醇
ユーザレビュー レビューDB ユーザのレビューに 似たもの タイトルが わからな かった タイトルの 意味は理解 できなかった
タイトルが 意味不明 結局タイトル はどう関連 する? 通常のRAGだと 01 意味的に似ているものではなく説明が欲しい
HyDE手法 02 ユーザレビュー LLM タイトルが わからな かった タイトルは、 ラストの... という意味
と思った。 タイトルの 意味は... という考え がしっくり。 タイトルは 文字通り... 仮説解説 タイトルの 意味は.... である。 仮説的文書埋め込み(HyDE): 疑似的に文書を生成することによって、目的の文書を取得する 解説文書
HyDEの課題 03 HyDE手法には限界がある 疑似文書を生成するプロンプト依存が大きい ユーザの入力クエリに対して一つのプロンプトは非現実的 DBの性質によって、スタイルやトーン、構造が一意でない場 合、疑似文書を生成するプロンプトによって検索が偏る
AutoHyDE 04 HyDEの網羅性を上げるために、どのような疑似的文章を生成すれ ばよいかを判別 検索結果 TOP100 keyword含む文書群 (重要かも) TOP20 TOP21~100
検索クエリ ヒロがミカに恋した理由 キーワード [”ヒロ”,”ミカ”,”恋”] キーワード抽出 ベクトル類似度検索 クラスタ1 クラスタ2 クラスタ3 疑似文書1 疑似文書2 疑似文書3 通常のRAG Auto-HyDE 類似度検索を信頼する数xn 20x5 =100 類似度検索で取得する文書
AutoHyDEへの所感 05 レビューは、HyDEの手法の課題で紹介されたスタイルやトーン、 構造が一意でないという最たる例 素のHyDEでは必要な、プロンプト調整の部分が自動化される 多視点を取ってくるということに対してクリティカル(な気がする) 懸念点 提案のみで精度評価がされていない 応答は遅くなる
参考文献 https://note.com/ippei_suzuki_us/n/n94cea16ac02e https://towardsdatascience.com/autohyde-making-hyde- better-for-advanced-llm-rag-619e58cdbd8e