Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介-AutoHyde
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
tomatolian
June 24, 2024
Research
0
36
論文紹介-AutoHyde
tomatolian
June 24, 2024
Tweet
Share
More Decks by tomatolian
See All by tomatolian
24時間AIハッカソン- HEAT
tomatolian
0
15
うみがめのスープを利用した学習アプリ - RSS ハッカソン
tomatolian
0
150
論文紹介 - Emotion Bench
tomatolian
0
27
Other Decks in Research
See All in Research
Proposal of an Information Delivery Method for Electronic Paper Signage Using Human Mobility as the Communication Medium / ICCE-Asia 2025
yumulab
0
170
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
760
Agentic AI フレームワーク戦略白書 (2025年度版)
mickey_kubo
1
120
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
1.2k
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp
1
450
LLMアプリケーションの透明性について
fufufukakaka
0
140
AIスーパーコンピュータにおけるLLM学習処理性能の計測と可観測性 / AI Supercomputer LLM Benchmarking and Observability
yuukit
1
660
Tiaccoon: Unified Access Control with Multiple Transports in Container Networks
hiroyaonoe
0
640
Thirty Years of Progress in Speech Synthesis: A Personal Perspective on the Past, Present, and Future
ktokuda
0
170
生成AI による論文執筆サポート・ワークショップ 論文執筆・推敲編 / Generative AI-Assisted Paper Writing Support Workshop: Drafting and Revision Edition
ks91
PRO
0
120
Can AI Generated Ambrotype Chain the Aura of Alternative Process? In SIGGRAPH Asia 2024 Art Papers
toremolo72
0
140
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
120
Featured
See All Featured
What does AI have to do with Human Rights?
axbom
PRO
0
2k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
0
160
The Curse of the Amulet
leimatthew05
1
8.7k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
230
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3k
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
440
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1k
Deep Space Network (abreviated)
tonyrice
0
64
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.7k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
97
Java REST API Framework Comparison - PWX 2021
mraible
34
9.1k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
7.9k
Transcript
HyDEの網羅性を上げる Auto-HyDE手法の提案 (2024/4/5投稿) 芸術工学府一年 鈴木醇
ユーザレビュー レビューDB ユーザのレビューに 似たもの タイトルが わからな かった タイトルの 意味は理解 できなかった
タイトルが 意味不明 結局タイトル はどう関連 する? 通常のRAGだと 01 意味的に似ているものではなく説明が欲しい
HyDE手法 02 ユーザレビュー LLM タイトルが わからな かった タイトルは、 ラストの... という意味
と思った。 タイトルの 意味は... という考え がしっくり。 タイトルは 文字通り... 仮説解説 タイトルの 意味は.... である。 仮説的文書埋め込み(HyDE): 疑似的に文書を生成することによって、目的の文書を取得する 解説文書
HyDEの課題 03 HyDE手法には限界がある 疑似文書を生成するプロンプト依存が大きい ユーザの入力クエリに対して一つのプロンプトは非現実的 DBの性質によって、スタイルやトーン、構造が一意でない場 合、疑似文書を生成するプロンプトによって検索が偏る
AutoHyDE 04 HyDEの網羅性を上げるために、どのような疑似的文章を生成すれ ばよいかを判別 検索結果 TOP100 keyword含む文書群 (重要かも) TOP20 TOP21~100
検索クエリ ヒロがミカに恋した理由 キーワード [”ヒロ”,”ミカ”,”恋”] キーワード抽出 ベクトル類似度検索 クラスタ1 クラスタ2 クラスタ3 疑似文書1 疑似文書2 疑似文書3 通常のRAG Auto-HyDE 類似度検索を信頼する数xn 20x5 =100 類似度検索で取得する文書
AutoHyDEへの所感 05 レビューは、HyDEの手法の課題で紹介されたスタイルやトーン、 構造が一意でないという最たる例 素のHyDEでは必要な、プロンプト調整の部分が自動化される 多視点を取ってくるということに対してクリティカル(な気がする) 懸念点 提案のみで精度評価がされていない 応答は遅くなる
参考文献 https://note.com/ippei_suzuki_us/n/n94cea16ac02e https://towardsdatascience.com/autohyde-making-hyde- better-for-advanced-llm-rag-619e58cdbd8e