Slide 1

Slide 1 text

Advanced RAG Strategies for Optimal Retrieval System Selection in Generative AI Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Marco Frodl Principal Consultant for Generative AI @marcofrodl

Slide 2

Slide 2 text

Special Day Generative AI fΓΌr Business-Anwendungen Thema Sprecher Datum, Uhrzeit Generative AI: Large Language Models – Szenarien, Use Cases und Patterns fΓΌr Business-Anwendungen Christian Weyer DI, 13. Februar 2024, 10.45 bis 11.45 Generative AI: A Story About LLM Prompting (and how Tools like TypeChat Can Help) Rainer Stropek DI, 13. Februar 2024, 12.15 bis 13.15 Generative AI: Semantische Suche und LLMs jenseits des Hello World- RAG-Tutorials Sebastian Gingter DI, 13. Februar 2024, 15.30 bis 16.30 Generative AI: Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Marco Frodl DI, 13. Februar 2024, 17.00 bis 18.00 Generative AI: Private GPT LLMs: Azure OpenAI Service sicher deployen mit Terraform Kenny Pflug DI, 13. Februar 2024, 19.00 bis 20.00

Slide 3

Slide 3 text

Why is it important? Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Generative AI User Input AI Processing Generated Output OpenAI GPTx DALL-E 3 GPT-4 Vision Whisper Text Text Text-to-Speech (TTS-1) Natural language is our new code

Slide 4

Slide 4 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl What is RAG? https://aws.amazon.com/what-is/retrieval-augmented-generation/ RAG = Ingestion + Retrieval

Slide 5

Slide 5 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Demo: RAG

Slide 6

Slide 6 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl

Slide 7

Slide 7 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl About Me Marco Frodl Principal Consultant for Generative AI Thinktecture AG X: @marcofrodl E-Mail: [email protected] https://www.thinktecture.com/thinktects/marco-frodl/

Slide 8

Slide 8 text

Ingestion Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Simple RAG in a nutshell Splitted (smaller) parts Embedding- Model Embedding π‘Ž 𝑏 𝑐 … Vector- Database Document Metadata: Reference to original document

Slide 9

Slide 9 text

Our sample content Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Simple RAG in a nutshell

Slide 10

Slide 10 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Demo: Ingestion

Slide 11

Slide 11 text

Similarity search in a Vector DB Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Simple RAG in a nutshell

Slide 12

Slide 12 text

Ingestion++ HyQE: Hypothetical Question Embedding Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Simple Advanced RAG in a nutshell LLM, e.g. GPT-3.5-turbo Transformed document Write 3 questions, which are answered by the following document. Chunk of Document Embedding- Model Embedding π‘Ž 𝑏 𝑐 … Vector- Database Metadata: content of original chunk

Slide 13

Slide 13 text

Ask me anything Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Simple RAG Question Prepare Search Search Results Question Answer LLM Vector DB Embedding Model Question as Vector Workflow Terms - Retriever - Chain Elements Embedding- Model Vector- DB Python LLM Langchain πŸ¦œπŸ”—

Slide 14

Slide 14 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Demo: Simple RAG

Slide 15

Slide 15 text

Similarity search in a Vector DB – Limits with K Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Simple RAG in a nutshell

Slide 16

Slide 16 text

Similarity search in a Vector DB – Threshold Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Simple RAG in a nutshell

Slide 17

Slide 17 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl How to Debug/Trace Generative AI-Apps?

Slide 18

Slide 18 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Demo: Debugging

Slide 19

Slide 19 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl GenAI Observability

Slide 20

Slide 20 text

Just one Vector DB? Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl What’s wrong with Simple RAG?

Slide 21

Slide 21 text

Just one Vector DB/Retriever? β€’ Multiple Generative AI-Apps β€’ Scaling and Load Balancing β€’ Query Parameter per Retriever β€’ Hosting (Environment, Product) β€’ Fast Updates & Re-Indexing β€’ Access Rights β€’ Custom Retriever Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl What’s wrong with Simple RAG? On-Premise AI-Apps Cloud Docs Public Tickets Features Website Sales Docs Internal Tickets πŸ¦œπŸ”— βœ… βœ… βœ…

Slide 22

Slide 22 text

Best source determination before the search Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Advanced RAG Question Retriever Selection 0-N Search Results Question Answer LLM Embedding Model Vector DB A Question as Vector Vector DB B LLM Prepare Search or

Slide 23

Slide 23 text

Best source determination before the search Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Advanced RAG Retriever Selection LLM Vector DB A Vector DB B or

Slide 24

Slide 24 text

Best source determination before the search Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Advanced RAG Question Retriever Selection 0-N Search Results Question Answer LLM Embedding Model Vector DB A Question as Vector Vector DB B LLM Prepare Search or Question Prepare Search Search Results Question Answer LLM Vector DB Embedding Model Question as Vector

Slide 25

Slide 25 text

Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Demo: Dynamic Retriever Selection with AI P

Slide 26

Slide 26 text

Dynamic Retriever Selection with AI Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Advanced RAG

Slide 27

Slide 27 text

Dynamic Retriever Selection with AI Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Advanced RAG

Slide 28

Slide 28 text

Dynamic Retriever Selection with AI Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Advanced RAG

Slide 29

Slide 29 text

Dynamic Retriever Selection with AI Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Advanced RAG

Slide 30

Slide 30 text

Dynamic Retriever Selection with AI Generative AI Optimierte Informationssuche durch AI-gesteuerte Datenquellenwahl Advanced RAG

Slide 31

Slide 31 text

Thank you! Any questions? Marco Frodl @marcofrodl Principal Consultant for Generative AI