Semantic AI als Weiterentwicklung von Generative AI kann der Schlüssel zur Integration von KI in eigene Lösungen sein. In diesem Vortrag zeigt Christian Weyer praxisnahe Architektur-Patterns und Ansätze für die Nutzung von Large und Small Language Models wie GPT oder Llama sowie Embedding-Modellen in modernen Softwarearchitekturen. Wichtige Konzepte wie Semantic Routing, Semantic Search und local RAG, Structured Output und Observability werden anhand eines End-to-End-Systems mit mehreren Services und Clientanwendungen demonstriert. Entwickler und Architekten erhalten einen pragmatischen Überblick über die mögliche Umsetzung in eigenen Projekten.