Der Einsatz von LLMs oder GenAI stellt neue Anforderungen an Observability. Ein- und Ausgaben von LLMs sind absolut unvorhersehbar, gerade im Einsatz in der Kundenkommunikation (z. B. als Chatbot). Dem Tracing kommt hier eine wesentlich Bedeutung zu, da so komplette Chatverläufe nachvollzogen werden können. In diesem Vortrag beleuchte ich neue Werkzeuge, die uns helfen, den Einsatz von LLMs in Java Microservices zu überwachen. Ich stelle Langfuse als spezialisierte Tracing-Lösung vor und beleuchte, wie eigene Metriken in Langchain4j erhoben werden können. Ich zeige, wie aktuelle Verbrauchsmetriken z. B. von Google Gemini in Prometheus überführt werden können, um gezielt zu alarmieren. Ich zeige, wie wir verhindern, dass sensible Daten im Tracing landen und wie wir Securityangriffe detailliert nachvollziehen können. Denn: Tracing und Security gehen im speziellen Chatbotumfeld Hand in Hand.