Upgrade to Pro — share decks privately, control downloads, hide ads and more …

From Zero to Production: Entwicklung einer eige...

From Zero to Production: Entwicklung einer eigenen GenAI Lösung

Dank leistungsstarker Frameworks und Bibliotheken können die ersten Generative AI-Anwendungen auf Hello-World-Niveau mit nur wenigen Codezeilen realisiert werden. Diese ersten Versuche stoßen jedoch genauso schnell an ihre Grenzen. Warum? Weil die Realität Herausforderungen mit sich bringt, die sich nicht so einfach mit diesem trivialen Ansatz lösen lassen. Aber was wird für eine Generative AI-Anwendung auf Unternehmensebene benötigt? Eine gut durchdachte Generative AI-Architektur! In diesem ganztägigen Hands-on-Workshop werden wir schrittweise eine komplexe Generative AI-Anwendung zur chatbasierten Abfrage des hauseigenen, verteilten Domänenwissens aufbauen. Beispiele für dieses verteilte Wissen könnte das gesamte Fachwissen einer IT-Abteilung, Produktinformationen und -spezifikationen eines internationalen Retailers oder das interne Mitarbeiter-Portal eines Großunternehmens sein. Beginnend mit einem minimalistischen RAG-System (Retrieval Augmented Generation) betrachten wir verschiedene Herausforderungen und diskutieren geeignete Lösungen. Am Ende werden wir eine Architektur haben, die den Herausforderungen der Realität standhält.

Lars Roewekamp

November 22, 2024
Tweet

More Decks by Lars Roewekamp

Other Decks in Technology

Transcript

  1. Generative AI Vom Prototypen zum produktiven Einsatz … und was

    das alles mit Architektur zu tun hat. #WISSENTEILEN powered by Lars Röwekamp | Tim Wüllner | open knowledge GmbH Hands-on Workshop
  2. Das ist eine Katze Das ist keine Katze Neuronale Netze

    aka traditionelle KI fit Neural Network Katze Katze Katze Katze Hund Hund
  3. Ist das eine Katze? Neuronale Netze aka traditionelle KI infer

    trained Neural Network mit Mustererkennug für Bilder von Katzen
  4. Generative AI Model Prompting Was ist eine Katze? Eine Katze

    ist* … und sieht so aus. Generative AI aka generierende KI *basierend auf meinem Weltwissen
  5. Generative AI vs traditionelle Neuronale Netze Predictive ML Model Generative

    Model lernt / erkennt Beziehungen zwischen Daten und Label lernt / versteht Zusammenhänge in unstrukturierten Daten Label neuer Content Label Daten Unstrukturierte Daten
  6. Generative AI unter der Haube Large Language Model Mary had

    a … Large Language Model Mary had a little … Next Token red little delicious … Probability 0.2 0.4 0.1 … Next Token mouse lamb kettle … Probability 0.2 0.3 0.2 …
  7. Generative AI unter der Haube 1. queen – woman +

    man = king 2. doctor – man + woman = nurse Male-Female Verb Tense Country-Capital
  8. Generative AI unter der Haube Transformer (LLM Layer) John wants

    his bank to cash the … ? word2vec style vectors
  9. Generative AI unter der Haube Transformer (LLM Layer) John wants

    his bank to cash the … ? John wants his bank to cash the … ? (verb) (verb) context aka hidden state
  10. Generative AI unter der Haube Transformer (LLM Layer) John wants

    his bank to cash the … ? John wants his bank to cash the … ? (verb) (verb) context aka hidden state Key-Vector: btw I‘am a noun describing a male person. Query-Vector: btw I‘am seeking for a noun describing a male person.
  11. Generative AI unter der Haube Transformer (LLM Layer) John wants

    his bank to cash the … ? Transformer (LLM Layer) context aka hidden state John wants his bank to cash the … ? (verb) (verb) (John‘s) (finance) John wants his bank to cash the … ? (verb) (verb) (male) ( ... )
  12. Generative AI unter der Haube Transformer (LLM Layer) John wants

    his bank to cash the … ? John (main character, male, married to Cheryl, cousin of Donald, from Minnesota, currently in Boise, … ) wants his bank to cash the … ?
  13. Generative AI unter der Haube Transformer (LLM Layer) John wants

    his bank to cash the … ? Transformer (LLM Layer) John wants his bank to cash the … (verb) (verb) (John‘s) (finance) John wants his bank to cash the … ? (verb) (verb) (male) Enough context information to be able to „guess“ the next word. check ( ... )
  14. Generative AI under the Hood Large Language Model Mary had

    a … Large Language Model Mary had a little … Next Token red little delicious … Probability 0.2 0.4 0.1 … Next Token mouse lamb kettle … Probability 0.2 0.3 0.2 …
  15. Generative AI am Beispiel Health Care Verbessern med. Bilder Entdecken

    neuer Medikamente* Vereinfachen med. Aufgaben Personalisierte Behandlung *via Generative Design
  16. Generative AI am Beispiel Advertising & Marketing Erstellen von Marketinginhalten

    Personalisierte Empfehlungen Produktbeschreibungen Verbessern der SEO
  17. Generative AI am Beispiel Media & Entertainment Audio- und Videoinhalte

    erstellen Event-Highlights zusammenstellen Generieren/verwalten von Tags
  18. Generative AI am Beispiel Financial Services Erstellen von Anlagestrategien Kommunikation

    und Schulung Investment Research Drafts Regulatorische Überwachung
  19. Generative AI am Beispiel Software Development Code generieren Tests automatisieren

    Programmiersprachen übersetzen Softwarelösungen erklären
  20. GenAI- Model Prompt GenAI Basics Model Selection Prompt Engineering 2

    1 „Was ist das schönste Reiseziel auf der Welt?“
  21. GenAI Hands-on Was wirst du lernen in dieser Übung: •

    Erstellen eines Jupyter NB in der Colab Umgebung. • Aufrufen eines GenAI Models mit individuellem Prompt via Provider-spezifischer API.
  22. GenAI- Model Prompt GenAI Basics Model Selection Prompt Engineering 2

    Model Selection 1 „Was ist das schönste Reiseziel auf der Welt?“ Welches Model? Welche Parameter? Welche Infrastruktur? Welche Lizenz? Welches Preismodell? Welche Governance?
  23. GenAI Basics Model Selection „Was misst ein AI-Benchmark?“ • Allgemeinwissen

    • Programmierung • Mathematik • ... Offizielle Benchmarks oftmals Teil der Trainigsdaten! • Kreativität • Faktenwissen • Logik
  24. GenAI Basics Model Selection aka „Wie finde ich das passende

    Model für mich?“ • für mein Problem • für meine Daten • für meinen Kontext • für meinen Geldbeutel
  25. GenAI Basics Model Selection aka „Wie finde ich das passende

    Model für mich?“ Public, Private, Sizes, Purpose Availability
  26. GenAI Basics Model Selection aka „Wie finde ich das passende

    Model für mich?“ Public, Private, Sizes, Purpose Data Privacy, Security, Explainability Availability Governance
  27. GenAI Basics Model Selection aka „Wie finde ich das passende

    Model für mich?“ Public, Private, Sizes, Purpose Data Privacy, Security, Explainability Complexity, Business Area Availability Governance Use Case
  28. GenAI Basics Model Selection aka „Wie finde ich das passende

    Model für mich?“ Public, Private, Sizes, Purpose Data Privacy, Security, Explainability Complexity, Business Area Latency, Cost, Customizeability Availability Governance Use Case Performance
  29. GenAI Basics Model Selection aka „Wie finde ich das passende

    Model für mich?“ Public, Private, Sizes, Purpose Data Privacy, Security, Explainability Complexity, Business Area Latency, Cost, Customizeability Traininig, Runtime, Availability Team Skills, Computational Power Availability Governance Use Case Performance Data Resources „Know Your Use-Case!“ *wenn du am Ende erfolgreich sein möchtest.
  30. GenAI- Model Prompt GenAI Basics Model Integration Prompt Engineering 2

    Model Selection 1 „Was ist das schönste Reiseziel auf der Welt?“ Passendes Model gefunden. Aber wie spreche ich es aus meiner Anwendung heraus an?
  31. Model A-small Model Provider model-name model-parameter provider-parameter prompt Model A-big

    Model B e.g. openAI, Google, … Provider Client API GenAI Basics Model Integration „Was ist das schönste Reiseziel auf der Welt?“ Reminder: 00-hello-genai.ipynb
  32. Model X mini Model Provider II model-name model-parameter provider-parameter prompt

    Model Y Model Y ++ e.g. openAI, Google, … Provider Client API GenAI Basics Model Integration „Was ist das schönste Reiseziel auf der Welt?“
  33. Model X mini Model Provider II Provider II Client API

    model-name model-parameter provider-parameter prompt Model Y Model Y ++ e.g. openAI, Google, … GenAI Basics Model Integration „Was ist das schönste Reiseziel auf der Welt?“
  34. Hub-Provider Client API model-name model-parameter hub-provider-parameter prompt e.g. Hugging-Face Provider-II

    hosted Models Provider-I hosted Models Hub-hosted Models* Hub-Provider Dispatcher *Provider X, fine-tuned or adapted, own GenAI Basics Model Integration Cloud based Resources „Was ist das schönste Reiseziel auf der Welt?“
  35. Hub-Provider Client API model-name model-parameter hub-provider-parameter prompt e.g. Hugging-Face Provider-II

    hosted Models Provider-I hosted Models Hub-hosted Models* Hub-Provider Dispatcher *Provider X, fine-tuned or adapted, own GenAI Basics Model Integration cloud-not-allowed exception „Was ist das schönste Reiseziel auf der Welt?“
  36. Local-Hub Provider Client API model-name model-parameter hub-provider-parameter prompt e.g. GPT4all,

    ollama Local hosted Models (Provider III) Local hosted Models (Provider II) Local hosted Models (own or adaptedI) Local-Hub Provider Dispatcher Local Machine GenAI Basics Model Integration „Was ist das schönste Reiseziel auf der Welt?“
  37. GenAI Basics Model Adaption „Welche zusätzlichen Stellschrauben habe ich?“ •

    Temperature Grad der „Fantasie“ • Max Tokens Länge der Antwort • Top K Auswahl der Treffer aus den top K Treffern • Top P Auswahl der Treffer aus den top P Prozent • Presence Penalty Wiederholungen werden vermieden • Frequence Penalty Wiederholungen werden gewichtet vermieden
  38. GenAI- Model Prompt Model Selection Prompt Engineering 2 1 GenAI

    Basics Prompt Engineering „„Was ist das schönste Reiseziel auf der Welt?“
  39. GenAI- Model Prompt Model Selection Prompt Engineering 2 1 Parts

    of a Prompt System vs User Prompt Principles of Prompting Chain-of-Thought Prompts Few-Shot Learning GenAI Basics Prompt Engineering „„Was ist das schönste Reiseziel auf der Welt?“
  40. GenAI Basics Prompt Engineering Role Instruction Example 1 Context Example

    n Question Who am I? What is my intention? What are helpful examples? Are there any additional information? BTW: what is the task I ask for? Wie sollte ein guter Prompt aufgebaut sein?
  41. GenAI Basics Good Prompt vs. Bad Prompt You I want

    to cook something. LR Topic: Recipe Recommendations
  42. GenAI Basics Good Prompt vs. Bad Prompt You I want

    to cook something. LR You Acting as an expert home cook, for someone who enjoys vegetarian Italian food and has only 30 minutes to prepare dinner, could you recommend a recipe including a list of ingredients and step-by- step instructions? LR Output Example Context Question Role Acting as an expert home cook, for someone who enjoys vegetarian Italian food and has only 30 minutes to prepare dinner, could you recommend a recipe including a list of ingredients and step-by-step instructions? You could point at recipes you like from the BBC’s Good Food guide, providing URL’s to recipes you love. Topic: Recipe Recommendations
  43. GenAI Basics Good Prompt vs. Bad Prompt You I want

    to learn something new. LR You Acting as a coding instructor, for a beginner with a goal to learn Python within 4 weeks, please provide a learning plan including resources and a weekly schedule for 10 hours per week. LR Output Example Context Question Role Acting as a coding instructor, for a beginner with a goal to learn Python within 4 weeks, Please provide a learning plan, including resources and a weekly schedule for 10 hours per week Point it at courses you’ve done in the past that you’ve liked. Tell it you like to learn by reading books, or websites, or by watching videos, or a mixture of both. Topic: Learning new skills
  44. GenAI Basics System Prompt vs. User Prompt System Assistant User

    „Du“ Chat-Model Verhalten des Assistenten ‘You're a friendly assistant.’
  45. GenAI Basics System Prompt vs. User Prompt System Assistant User

    ‘You're a friendly assistant.’ „Du“ Chat-Model Verhalten des Assistenten
  46. GenAI Basics System Prompt vs. User Prompt System Assistant User

    ‘You're a friendly assistant and always keep things brief.’ ‚Which is the most beautiful city in the world?‘ ‚Which is the most beautiful city in the world?‘ ‘You are a philosopher and have a tendency to be verbose.’ ??? ??? „Du“ Chat-Model Verhalten des Assistenten
  47. GenAI Basics System Prompt vs. User Prompt System-Prompt: ‘You're a

    friendly assistant and always keep things brief.’ Assistant: 65 Tokens
  48. GenAI Basics System Prompt vs. User Prompt System-Prompt: ‘You are

    a philosopher and have a tendency to be verbose.’ Assistant: 434 Tokens
  49. GenAI Basics Prompt Engineering You Brainstorm a list of product

    names for a shoe that fits any foot size, in the style of Steve Jobs. Return the result as a comma separated list, in this format: Product description: A shoe that fits any foot size Product name: [list of 3 names] ## Examples Product description: A refrigerator that dispenses beer Product names: iBarFridge, iFridgeBeer, iDrinkBeerFridge Product description: A watch that can tell accurate time in space Product names: iNaut, iSpace, iTime ChatGPT Product description: A shoe that fits any foot size Product names: iFitFoot, iPerfectFit, iShoeSize <10/10> LR Prompt Engineering Principles Source: Prompt Engineering for Generative AI, James Phoenix & Mike Taylor, O‘Reilly 2024
  50. GenAI Basics Prompt Engineering You Brainstorm a list of product

    names for a shoe that fits any foot size, in the style of Steve Jobs. Return the result as a comma separated list, in this format: Product description: A shoe that fits any foot size Product name: [list of 3 names] ## Examples Product description: A refrigerator that dispenses beer Product names: iBarFridge, iFridgeBeer, iDrinkBeerFridge Product description: A watch that can tell accurate time in space Product names: iNaut, iSpace, iTime ChatGPT Product description: A shoe that fits any foot size Product names: iFitFoot, iPerfectFit, iShoeSize <10/10> LR 1. Give Direction Describe the desired style in detail, or reference a relevant persona.
  51. GenAI Basics Prompt Engineering You Brainstorm a list of product

    names for a shoe that fits any foot size, in the style of Steve Jobs. Return the result as a comma separated list, in this format: Product description: A shoe that fits any foot size Product name: [list of 3 names] ## Examples Product description: A refrigerator that dispenses beer Product names: iBarFridge, iFridgeBeer, iDrinkBeerFridge Product description: A watch that can tell accurate time in space Product names: iNaut, iSpace, iTime ChatGPT Product description: A shoe that fits any foot size Product names: iFitFoot, iPerfectFit, iShoeSize <10/10> LR 1. Give Direction Describe the desired style in detail, or reference a relevant persona. 2. Specify Format Define the rules to follow, and the required structure to respond.
  52. GenAI Basics Prompt Engineering You Brainstorm a list of product

    names for a shoe that fits any foot size, in the style of Steve Jobs. Return the result as a comma separated list, in this format: Product description: A shoe that fits any foot size Product name: [list of 3 names] ## Examples Product description: A refrigerator that dispenses beer Product names: iBarFridge, iFridgeBeer, iDrinkBeerFridge Product description: A watch that can tell accurate time in space Product names: iNaut, iSpace, iTime ChatGPT Product description: A shoe that fits any foot size Product names: iFitFoot, iPerfectFit, iShoeSize <10/10> LR 1. Give Direction Describe the desired style in detail, or reference a relevant persona. 2. Specify Format Define the rules to follow, and the required structure to respond. 3. Provide Examples Insert a deverse set if test cases where the task was done correctly.
  53. GenAI Basics Prompt Engineering You Brainstorm a list of product

    names for a shoe that fits any foot size, in the style of Steve Jobs. Return the result as a comma separated list, in this format: Product description: A shoe that fits any foot size Product name: [list of 3 names] ## Examples Product description: A refrigerator that dispenses beer Product names: iBarFridge, iFridgeBeer, iDrinkBeerFridge Product description: A watch that can tell accurate time in space Product names: iNaut, iSpace, iTime ChatGPT Product description: A shoe that fits any foot size Product names: iFitFoot, iPerfectFit, iShoeSize <10/10> LR 1. Give Direction Describe the desired style in detail, or reference a relevant persona. 2. Specify Format Define the rules to follow, and the required structure to respond. 3. Provide Examples Insert a deverse set if test cases where the task was done correctly. 4. Evaluate Quality Identify errors and rate responses, Testing what drives performance.
  54. GenAI Basics Prompt Engineering You Brainstorm a list of product

    names for a shoe that fits any foot size, in the style of Steve Jobs. Return the result as a comma separated list, in this format: Product description: A shoe that fits any foot size Product name: [list of 3 names] ## Examples Product description: A refrigerator that dispenses beer Product names: iBarFridge, iFridgeBeer, iDrinkBeerFridge Product description: A watch that can tell accurate time in space Product names: iNaut, iSpace, iTime ChatGPT Product description: A shoe that fits any foot size Product names: iFitFoot, iPerfectFit, iShoeSize <10/10> LR 1. Give Direction Describe the desired style in detail, or reference a relevant persona. 2. Specify Format Define the rules to follow, and the required structure to respond. 3. Provide Examples Insert a deverse set if test cases where the task was done correctly. 4. Evaluate Quality Identify errors and rate responses, Testing what drives performance. You Please rate the product names based on their catchines, uniqueness, simplicity. Rate them on a scale from 1 to 5, with being 5 the highest score. Respond only with a table containing the results. LR ChatGPT Product Name Catchiness Uniqueness Simplicity iFitFoot 4 4 4 iPerfectFit 5 4 3 iShoeSize 3 3 5 5. Devide Labor Split the task into multiple steps, chained together for complex goals.
  55. GenAI Basics Prompt Engineering You Question: Roger has 5 tennis

    balls. He buys 2 more cans of tennis balls. Each can has 3 tennis balls. How many tennis balls does he have? Answer: The answer is 11. Question: The cafeteria had 23 apples. If they used 20 to make lunch and bought 6 more, how many apples do they have? ChatGPT The answer is 27. [NOT CORRECT] LR Chain of Thoughts Pattern
  56. GenAI Basics Prompt Engineering You Question: Roger has 5 tennis

    balls. He buys 2 more cans of tennis balls. Each can has 3 tennis balls. How many tennis balls does he have? Answer: Roger started with 5 balls. 2 cans of 3 tennis balls each is 6 tennis balls. 5 + 6 = 11. The answer is 11. Question: The cafeteria had 23 apples. If they used 20 to make lunch and bought 6 more, how many apples do they have? ChatGPT A cafeteria had 23 apples originally. They used 20 to make lunch. So they had 23 - 20 = 3. They bought 6 more apples, so they have 3 + 6 = 9. The answer is 9. [CORRECT] LR „Anstatt das Sprachmodell direkt aufzufordern, das Problem zu lösen, verwenden wir eine Gedankenkette als Aufforderung, um das Modell durch Zwischenschritte zu führen."
  57. GenAI Basics Prompt Engineering You Please choose the best explanation

    to the question: Question: How is snow formed? Explanation1: Snow is formed when water vapor in the air freezes into ice crystals in the atmosphere, which can combine and grow into snowflakes as they fall through the atmosphere and accumulate on the ground. Explanation2: Water vapor freezes into ice crystals forming snow. Answer: ChatGPT Explanation 1 is the better explanation. It provides a more detailed and complete description of the process. It explains that water vapor freezes into ice crystals in the atmosphere and how these crystals can combine to form snowflakes as they fall through the air before accumulating on the ground. This explanation gives a clearer understanding of the formation process of snow compared to the shorter Explanation 2. LR Few-Shot Learning Pattern ???
  58. GenAI Basics Prompt Engineering You Please choose the best explanation

    to the question: Question: Why is sky blue? Explanation1: The sky appears blue because of Rayleigh scattering, … making the sky look blue. Explanation2: Due to Rayleigh scattering effect. Answer: Explanation2 Question: What is the cause of earthquakes? Explanation1: Sudden release of energy in the Earth's crust. Explanation2: Earthquakes happen when tectonic plates suddenly slip or break apart, …. cause damage. Answer: Explanation1 Question: How is snow formed? Explanation1: Snow is formed when water vapor in the air freezes into ice crystals in the atmosphere, … on the ground. Explanation2: Water vapor freezes into ice crystals forming snow. Answer: ChatGPT Explanation 2. LR Beispiel 2 Beispiel 1 ??? „Anstatt ein Modell mit vielen, vielen Daten zu füttern, geben wir ihm einige wenige Beispiele zur Orientierung."
  59. GenAI Hands-on Was wirst du lernen in dieser Übung: •

    Prompten mit dediziertem System Prompt. • Anwenden von Prompting Patterns und Best Practices. • GenAI Completion via Model Parameter beeinflussen.
  60. GenAI- Model Prompt GenAI Basics myDomain + „Leave regulation at

    open knowledge“ „Wie beantrage ich Urlaub bei open knowledge?“
  61. GenAI- Model Prompt GenAI Basics myDomain + „Wie beantrage ich

    Urlaub bei open knowledge?“ „Urlaubsregelung bei open knowledge“
  62. GenAI- Model Prompt GenAI Basics myDomain + „Wie aktiviere ich

    die Alarmanlage bei open knowledge?“ „Urlaubsregelung bei open knowledge“
  63. GenAI- Model Prompt GenAI Basics myDomain + + „Wie aktiviere

    ich die Alarmanlage bei open knowledge?“ „Urlaubsregelung + Alarmanlage bei open knowledge“
  64. GenAI- Model Prompt GenAI Basics myDomain + „Alles interne Wissen

    (Wiki, DB, …) bei open knowledge“ „Wie mache ich XYZ bei open knowledge?“
  65. GenAI- Model Prompt GenAI Basics myDomain + ERROR: Token Limit

    exceeded Output Size Context Window Size „Wie mache ich XYZ bei open knowledge?“ „Alles interne Wissen (Wiki, DB, …) bei open knowledge“
  66. GenAI- Model Prompt GenAI Basics myDomain + ERROR: Out-of-Budget Exception

    Context Window Size „Alles interne Wissen (Wiki, DB, …) bei open knowledge“ „Wie mache ich XYZ bei open knowledge?“
  67. GenAI- Model Prompt GenAI Basics myDomain + ERROR: Lost-in-the-Middle Context

    Window Size „Wie mache ich XYZ bei open knowledge?“
  68. GenAI Basics myDomain „Was sind Token Limits?“ • Context Window

    Size • Output Size • lange Anfragen sind teuer • lange Antworten sind noch teurer
  69. Source: GenAI Pricing on Medium.com, Ragesh Gohel, March 2024 128.000

    Tokens? Kling viel! Ist aber für myDomain in der Regel zu wenig! 128.000 Tokens entsprechen ca. 350 Buchseiten. Harry Potter hat > 1 Mio.Wörter auf über 6.000 Seiten!
  70. GenAI- Model Prompt GenAI Advanced myDomain + ERROR: Token Limit

    exceeded! Output Size Context Window Size „Alles interne Wissen bei open knowledge“ „Wie mache ich XYZ bei open knowledge?“
  71. myGenAI Model Prompt GenAI Advanced myDomain „Wie mache ich XYZ

    bei open knowledge?“ „Alles interne Wissen bei open knowledge“
  72. myGenAI Model Prompt GenAI Advanced myDomain Option 1: Build own

    Model Option 2: Fine-tune existing Model ERROR: Way to expensive ERROR: Way to complex WARNING: Out-of-Sync „Wie mache ich XYZ bei open knowledge?“ „Alles interne Wissen bei open knowledge“
  73. Prompt GenAI- Model GenAI Advanced myDomain „Alles interne Wissen bei

    open knowledge“ SOME MAGIC „Wie mache ich XYZ bei open knowledge?“
  74. Prompt Retrieve Augment Ingesting- Pipeline Knowledge Database Retriever GenAI- Model

    GenAI Advanced myDomain „Alles interne Wissen bei open knowledge“ „Wie mache ich XYZ bei open knowledge?“
  75. Prompt Ingesting- Pipeline Knowledge Database Retriever GenAI Advanced myDomain R

    etrieval Augmented Generation „Alles interne Wissen bei open knowledge“ „Wie mache ich XYZ bei open knowledge?“
  76. Prompt Ingesting- Pipeline Knowledge Database Retriever GenAI Advanced RAG Systems

    R etrieval Augmented Generation „Alles interne Wissen bei open knowledge“ „Wie mache ich XYZ bei open knowledge?“
  77. Prompt Ingesting- Pipeline Knowledge Database Retriever GenAI Advanced RAG Systems

    R etrieval Augmented Generation „Alles interne Wissen bei open knowledge“ „Wie mache ich XYZ bei open knowledge?“
  78. GenAI Advanced RAG Systems GenAI Model Ingesting-Pipeline (Async.) Retriever Chunking

    Embedding Retrieval-Pipeline (Sync.) Query- Embedding Top-k Fetching Augmenting UI/UX „Wie mache ich XYZ bei open knowledge?“
  79. „Die Veröffentlichung von ChatGPT jährt sich nun bald zum zweiten

    Mal. Ein Ende des Hypes ist noch lange nicht abzusehen. Zu groß sind die Mehrwerte dieser Technologie, zu intuitiv ist der Umgang in Form eines Chats. Für das Jahr 2024 wurde erwartet, dass der Sprung vom explorativen Herumspielen mit Large Language Models […].“ Document (Doc. Id:1) Chunking Embedding Ingesting Pipeline am Beispiel
  80. „Die Veröffentlichung von ChatGPT jährt sich nun bald zum zweiten

    Mal. Ein Ende des Hypes ist noch lange nicht abzusehen. Zu groß sind die Mehrwerte dieser Technologie, zu intuitiv ist der Umgang in Form eines Chats. Für das Jahr 2024 wurde erwartet, dass der Sprung vom explorativen Herumspielen mit Large Language Models […].“ [„Die Veröffentlichung von ChatGPT jährt sich nun bald zum zweiten Mal. Ein Ende des Hypes ist noch lange nicht abzusehen.“] [„Zu groß sind die Mehrwerte dieser Technologie, zu intuitiv ist der Umgang in Form eines Chats.“] […] Document (Doc. Id:1) Chunking Embedding Ingesting Pipeline am Beispiel
  81. „Die Veröffentlichung von ChatGPT jährt sich nun bald zum zweiten

    Mal. Ein Ende des Hypes ist noch lange nicht abzusehen. Zu groß sind die Mehrwerte dieser Technologie, zu intuitiv ist der Umgang in Form eines Chats. Für das Jahr 2024 wurde erwartet, dass der Sprung vom explorativen Herumspielen mit Large Language Models […].“ [„Die Veröffentlichung von ChatGPT jährt sich nun bald zum zweiten Mal. Ein Ende des Hypes ist noch lange nicht abzusehen.“] [„Zu groß sind die Mehrwerte dieser Technologie, zu intuitiv ist der Umgang in Form eines Chats.“] […] Document (Doc. Id:1) Chunking Embedding [-0.24, 0.15, …, 0.52] [-0.13, 0.95, …, 0.31] […] Ingesting Pipeline am Beispiel
  82. „Die Veröffentlichung von ChatGPT jährt sich nun bald zum zweiten

    Mal. Ein Ende des Hypes ist noch lange nicht abzusehen. Zu groß sind die Mehrwerte dieser Technologie, zu intuitiv ist der Umgang in Form eines Chats. Für das Jahr 2024 wurde erwartet, dass der Sprung vom explorativen Herumspielen mit Large Language Models […].“ [„Die Veröffentlichung von ChatGPT jährt sich nun bald zum zweiten Mal. Ein Ende des Hypes ist noch lange nicht abzusehen.“] [„Zu groß sind die Mehrwerte dieser Technologie, zu intuitiv ist der Umgang in Form eines Chats.“] […] Document (Doc. Id:1) Id Doc. Id Embedding 1 1 [-0.24, 0.15, …, 0.52] 2 1 [-0.13, 0.95, …, 0.31] […] […] […] Chunking Embedding [-0.24, 0.15, …, 0.52] [-0.13, 0.95, …, 0.31] […] Ingesting Pipeline am Beispiel
  83. Retrieval Pipeline am Beispiel Embedding Top-k Fetching Augmenting „Wovon handelt

    der Vortrag „Die Architektur für Sprachmodelle in der Praxis - Retrieval Augmented Generation“?“
  84. Retrieval Pipeline am Beispiel Embedding Top-k Fetching Augmenting „Wovon handelt

    der Vortrag „Die Architektur für Sprachmodelle in der Praxis - Retrieval Augmented Generation“?“ [0.35, 0.25, …, 0.62]
  85. Retrieval Pipeline am Beispiel Embedding Top-k Fetching Augmenting Embeddings aus

    Knowledge Base Embeddings Dimension 1 Embed. Dim. 2 Top-k=1 Dokument „Wovon handelt der Vortrag „Die Architektur für Sprachmodelle in der Praxis - Retrieval Augmented Generation“?“ [0.35, 0.25, …, 0.62]
  86. Retrieval Pipeline am Beispiel Embedding Top-k Fetching Augmenting Embeddings aus

    Knowledge Base Embeddings Dimension 1 Embed. Dim. 2 Top-k=1 Dokument „Wovon handelt der Vortrag „Die Architektur für Sprachmodelle in der Praxis - Retrieval Augmented Generation“?“ [0.35, 0.25, …, 0.62] & „Wovon handelt der Vortrag […] basierend auf folgendem Kontext: „Durch ein vorgeschaltetes Retrieval, um relevante Informationen aus einer eigenen dynamischen Datenbasis hinzuziehen, können fundierte Antworten geliefert werden.“
  87. GenAI Hands-on Was wirst du lernen in dieser Übung: •

    Implementieren eines RAG-Systems mit Hilfe von Ingestion- und Retrieval-Pipelines. • Anwenden des RAG für Fragen aus der Domäne.
  88. Retrieval Augmented Knowledge Database Retriever Generation Ingesting- Pipeline GenAI Advanced

    RAG Systems „Wie beantrage ich Urlaub bei open knowledge?“
  89. Retrieval Augmented Knowledge Database Retriever Generation Ingesting- Pipeline GenAI Advanced

    RAG Systems „Urlaub? So wie du arbeitest? Du faules Stück!“ „Wie beantrage ich Urlaub bei open knowledge?“
  90. Retrieval Augmented Knowledge Database Retriever Generation Ingesting- Pipeline „Wie beantrage

    ich Urlaub bei open knowledge?“ GenAI Professional Guardrails „Urlaub? So wie du arbeitest? Du faules Stück!“
  91. Retrieval Augmented Knowledge Database Retriever Generation Guarding Output Ingesting- Pipeline

    GenAI Professional Guardrails Output Profanity Check „Wie beantrage ich Urlaub bei open knowledge?“ „Urlaub? So wie du arbeitest? Du faules Stück!“
  92. Retrieval Augmented Knowledge Database Retriever Generation Guarding Output Ingesting- Pipeline

    GenAI Professional Guardrails „Das kann ich leider nicht beantworten.“ Output Profanity Check „Wie beantrage ich Urlaub bei open knowledge?“ „Urlaub? So wie du arbeitest? Du faules Stück!“ „…. Faules Stück …“
  93. Retrieval Augmented Knowledge Database Retriever Generation Input Output Ingesting- Pipeline

    GenAI Professional Guardrails Guarding „Was soll ich heute Abend kochen?“ Topic Check
  94. Retrieval Augmented Knowledge Database Retriever Generation Input Output Ingesting- Pipeline

    GenAI Professional Guardrails Guarding „Was soll ich heute Abend kochen?“ „Sorry, aber das fällt nicht in meinen Aufgabenbereich.“ Topic Check
  95. Retrieval Augmented Knowledge Database Retriever Generation Input Output Ingesting- Pipeline

    GenAI Professional Guardrails Output-Governance: Toxic Speech, Fact-Checking, Ethical-Guidelines, Cross-Validation, … Input-Evaluation: Prompt-Injection, Jailbreak-Versuche, Topic-Filter, PII-Cleansing, Rate-Limiting,… Guarding
  96. GenAI Hands-on Was wirst du lernen in dieser Übung: •

    Erstellen eigener Guardrails zum Verhindern toxischer Sprache. • Implementieren eines Fact- Checkers Output Guardrails.
  97. Retrieval Augmented Knowledge Database Retriever Generation Input Output Ingesting- Pipeline

    GenAI Professional Guarding Was fehlt noch für ein professionelles und produktives System?
  98. Retrieval Augmented Knowledge Database Retriever Generation Input Output Ingesting- Pipeline

    RAG-Monitoring Cost- Monitoring Model- Monitoring Response-Quality- Monitoring GenAI Professional Monitoring Guarding Ragas: https://docs.ragas.io/en/stable/concepts/metrics
  99. Retrieval Augmented Generation GenAI Professional Response Quality Monitoring https://docs.confident-ai.com/docs/metrics-llm-evals G-Eval

    Summerization Answer Relevancy Faithfulness Summerization Hallucination Contextual Recall Contextual Relevancy Contextual Precision relevanter Kontext generierte Antwort User Input
  100. Retrieval Augmented Generation GenAI Professional Response Quality Monitoring Faithfulness relevanter

    Kontext generierte Antwort User Input Wird die durch unterstützt?
  101. Retrieval Augmented Generation relevanter Kontext generierte Antwort User Input GenAI

    Professional Response Quality Monitoring Answer Relevancy Passt die zum ?
  102. GenAI Professional Response Quality Monitoring Step 1: Generiere mögliche Antworten

    ( ) aus Embeddings Dimension 1 Embed. Dim. 2 Answer Relevancy Passt die zum ?
  103. GenAI Professional Response Quality Monitoring Step 1: Generiere mögliche Antworten

    ( ) aus Step 2: Berechne die mittlere Distanz von Embeddings Dimension 1 Embed. Dim. 2 Answer Relevancy Passt die zum ?
  104. Retrieval Augmented Knowledge Database Retriever Generation Guarding Input Output Ingesting-

    Pipeline RAG-Monitoring Cost- Monitoring Model- Monitoring Response-Quality- Monitoring GenAI Best Practices Real Life Survival Guide
  105. GenAI Model UI/UX Guardrails Output Ingesting-Pipeline (Async.) Chunking Embedding Retrieval-Pipeline

    (Sync.) Query- Embedding Top-k Fetching Augmenting Input GenAI Best Practices Real Life Survival Guide Hallucination (via Faithfulness / Answer Relevancy)
  106. GenAI Model UI/UX Guardrails Output Ingesting-Pipeline (Async.) Chunking Embedding Retrieval-Pipeline

    (Sync.) Query- Embedding Top-k Fetching Augmenting Input Missing Data GenAI Best Practices Real Life Survival Guide
  107. GenAI Model UI/UX Guardrails Output Ingesting-Pipeline (Async.) Chunking Embedding Retrieval-Pipeline

    (Sync.) Query- Embedding Top-k Fetching Augmenting Input Missing Data GenAI Best Practices Real Life Survival Guide Chunk not found
  108. GenAI Model UI/UX Guardrails Output Ingesting-Pipeline (Async.) Chunking Embedding Retrieval-Pipeline

    (Sync.) Query- Embedding Top-k Fetching Augmenting Input Missing Data GenAI Best Practices Real Life Survival Guide Chunk not found Chunk not relevant
  109. Ingesting-Pipeline (Async.) Chunking Embedding Real Life RAG #1 Missing-Data Challenge

    Missing Data Problem: RAG kennt die benötigten Daten nicht.
  110. Ingesting-Pipeline (Async.) Chunking Embedding Real Life RAG #1 Missing-Data Challenge

    Missing Data Problem: RAG kennt die benötigten Daten nicht. Lösung: Passenden Ingestor implementieren.
  111. Ingesting-Pipeline (Async.) Chunking Embedding Real Life RAG #1 Missing-Data Challenge

    Missing Data Problem: Snapshot der Daten ist nicht aktuell genug.
  112. Ingesting-Pipeline (Async.) Chunking Embedding Real Life RAG #1 Missing-Data Challenge

    Missing Data Problem: Snapshot der Daten ist nicht aktuell genug. Lösung: Schnittstelle zum „kontinuierlichen“ Data-Sync.
  113. Top-k Fetching Ingesting-Pipeline (Async.) Chunking Embedding Augmenting Retrieval-Pipeline (Sync.) Real

    Life RAG #2 Chunk-not-found Challenge Chunk not found Query- Embedding
  114. Top-k Fetching Ingesting-Pipeline (Async.) Chunking Embedding Augmenting Retrieval-Pipeline (Sync.) Real

    Life RAG #2 Chunk-not-found Challenge Chunk not found Problem: Vorhandene Chunks werden nicht gefunden. Query- Embedding
  115. Top-k Fetching Ingesting-Pipeline (Async.) Chunking Embedding Augmenting Retrieval-Pipeline (Sync.) Real

    Life RAG #2 Chunk-not-found Challenge Chunk not found Problem: Vorhandene Chunks werden nicht gefunden. Lösung #1: Chunk-Sizes und Overlapping adaptieren. Query- Embedding
  116. Top-k Fetching Ingesting-Pipeline (Async.) Chunking Embedding Augmenting Retrieval-Pipeline (Sync.) Real

    Life RAG #2 Chunk-not-found Challenge Chunk not found Problem: Vorhandene Chunks werden nicht gefunden. Lösung #2: Andere Splitter verwenden (e.g. Semantic-Splitter). Query- Embedding
  117. Top-k Fetching Ingesting-Pipeline (Async.) Chunking Embedding Augmenting Retrieval-Pipeline (Sync.) Real

    Life RAG #2 Chunk-not-found Challenge Chunk not found Problem: Vorhandene Chunks werden nicht gefunden. Lösung#3: Optimierung des Distanz-Thresholds bzw. k aus Top-k Query- Embedding
  118. Top-k Fetching Ingesting-Pipeline (Async.) Chunking Embedding Augmenting Retrieval-Pipeline (Sync.) Real

    Life RAG #2 Chunk-not-found Challenge Chunk not found Problem: Vorhandene Chunks werden nicht gefunden. Lösung #4: Auswahl eines besser geeigneten Embedding-Models. Query- Embedding
  119. Top-k Fetching Ingesting-Pipeline (Async.) Chunking Embedding Augmenting Retrieval-Pipeline (Sync.) Real

    Life RAG #2 Chunk-not-found Challenge Chunk not found Problem: Vorhandene Chunks werden nicht gefunden. Lösung #5: Hypothetical Document Embeddings (HyDE) Input HyDE Query- Embedding
  120. Guardrails Input Output Gao et al. (2023) HyDE = Hypothetical

    Document Embeddings Real Life RAG #2 Chunk-not-found Challenge HyDE
  121. Real Life RAG #3 Chunk-not-relevant Challenge Chunk not relevant GenAI

    Model Top-k Fetching Augmenting Retrieval-Pipeline (Sync.) Query- Embedding
  122. Real Life RAG #3 Chunk-not-relevant Challenge Problem: Chunk wird vom

    Model nicht als relevant erachtet. Chunk not relevant GenAI Model Top-k Fetching Augmenting Retrieval-Pipeline (Sync.) Query- Embedding
  123. Real Life RAG #3 Chunk-not-relevant Challenge Chunk not relevant Top-k

    Fetching Augmenting Retrieval-Pipeline (Sync.) Problem: Chunk wird vom Model nicht als relevant erachtet. Lösung #1: Für den Use-Case besser geeignetes Modell wählen. GenAI Model Query- Embedding
  124. Real Life RAG #3 Chunk-not-relevant Challenge Chunk not relevant Top-k

    Fetching Augmenting Retrieval-Pipeline (Sync.) GenAI Model Problem: Chunk wird vom Model nicht als relevant erachtet. Lösung #2: Chunk um zusätzlichen Context erweitern (small-to-big). Chunk Query- Embedding
  125. GenAI Model UI/UX Guardrails Input Output Ingesting-Pipeline (Async.) Chunking Embedding

    Retrieval-Pipeline (Sync.) Top-k Fetching Augmenting Query- Embedding
  126. GenAI Hands-on Was wirst du lernen in dieser Übung: •

    Überleben im RAG-Dschungel: Anwenden von Pattern und Best Practices für Content- Ingestion und -Retrieval.
  127. Prompt Retrieve Augment Ingesting- Pipeline Knowledge Database Retriever GenAI- Model

    GenAI Outlook Was gibt es noch zu bedenken? „How to apply for vacation at open knowledge?“ „Alles interne Wissen bei open knowledge“
  128. UI/UX Enterprise Integration „Comment demander des vacances chez ok?“ Retrieve

    Augment Ingesting- Pipeline Retriever GenAI- Model Knowledge Database „Wie beantrage ich Urlaub bei open knowledge?“ GenAI Outlook Multi-Language RAG „Alles interne Wissen bei open knowledge“
  129. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Retriever GenAI- Model

    Language- Detection Translation Translation Translation GenAI Outlook Multi-Language RAG Knowledge Database „Comment demander des vacances chez ok?“ „Alles interne Wissen bei open knowledge“
  130. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Knowledge Database Retriever

    GenAI- Model Translation Translation Translation Translation FR_fr language not supported domain specific wording GenAI Outlook Multi-Language RAG Language- Detection „Comment demander des vacances chez ok?“ „Alles interne Wissen bei open knowledge in mehreren Sprachen.“
  131. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Retriever GenAI- Model

    Knowledge Database GenAI Outlook Access Control „Wie beantrage ich Urlaub bei open knowledge?“ „Alles interne Wissen bei open knowledge“
  132. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Retriever GenAI- Model

    Knowledge Database GenAI Outlook Access Control „Was sind die geheimen KPIs von open knowledge?“ „Alles interne Wissen bei open knowledge“ incl C-Level Informationen.“
  133. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Retriever GenAI- Model

    Token Knowledge Database Input Guardrail Eine Art von Attacke? Prompt-Injection? Prompt-Abuse? Rate-Limit? GenAI Outlook Access Control „Was sind die geheimen KPIs von open knowledge?“ „Alles interne Wissen bei open knowledge“ incl C-Level Informationen.“
  134. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Knowledge Database incl.

    AC Meta Data Retriever GenAI- Model RBAC via PBF Token Token Input Guardrail GenAI Outlook Access Control RBAC = Role based Access Control PBF = Permission based Filtering „Was sind die geheimen KPIs von open knowledge?“ „Alles interne Wissen bei open knowledge“ incl C-Level Informationen.“
  135. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Knowledge Database with

    AC Meta Data Retriever GenAI- Model RBAC via PBF Token Token Input Guardrail Output Guardrail PII: Personally identifiable information? GenAI Outlook Access Control „Wie sehen die persönlchen Daten von X aus bei ok?“ „Alles interne Wissen bei open knowledge“ incl C-Level Informationen.“
  136. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Retriever GenAI- Model

    Knowledge Database GenAI Outlook Integration „Wie beantrage ich Urlaub bei open knowledge?“ „Alles interne Wissen bei open knowledge“
  137. GenAI Outlook Integration GenAI based Service A P I ML

    as a Service Input Output UI/UX Enterprise Integration „Wie beantrage ich Urlaub bei open knowledge?“ „Alles interne Wissen bei open knowledge“
  138. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Knowledge Database Retriever

    GenAI- Model GenAI Outlook Multi-Agenten Systeme „Wie beantrage ich Urlaub bei open knowledge?“ „Alles interne Wissen bei open knowledge“
  139. UI/UX Enterprise Integration Retrieve Augment Ingesting- Pipeline Knowledge Database Retriever

    GenAI- Model GenAI Outlook Multi-Agenten Systeme „Beantrage meinen Urlaub von […] bis [… ] bei ok, bitte.“ „Alles interne Wissen bei open knowledge“
  140. GenAI Outlook Multi-Agenten Systeme Retriever Memory Tools Planning Database Prompting

    Models API-Call UI/UX „Ich habe deinen Urlaub beantragt.“ „Beantrage meinen Urlaub von […] bis [… ] bei ok, bitte.“
  141. GenAI vom Prototypen zum produktiven Einsatz Was du heute mitnehmen

    solltest: • GenAI ist mächtig. Mächtig teuer. • Der Prompt ist dein Freund. • Jedes Modell ist anders. • RAG für eigenes Domänenwissen. • GenAI ist auch nur Software. Dein Use Case bestimmt den richtigen Weg!
  142. „When deploying Generative AI technology, it is essential to adhere

    to best practices including employing models through validation, understanding the model’s limitations, ensuring ethical use, and monitoring for biases continuously.“ (Source: https://www.tredence.com/generative-ai-101)
  143. #WISSENTEILEN #WISSENTEILEN BILDNACHWEISE Folie 21: © photoplotnikov - istockphoto.com Folie

    23: © Mix und Match Studios - shutterstock.com Folie 23: © Mix und Match Studios - shutterstock.com Alle anderen Bilder, , Zeichnungen und icons stammen aus den folgenden freien Quellen • pexels.com, • pixabay.com, • unsplash.com, • flaticon.com oder wurden von mir selbst erstellt.