Der Einsatz von LLMs oder GenAI stellt neue Anforderungen an Observability. Ein- und Ausgaben von LLMs sind absolut unvorhersehbar, gerade im Einsatz in der Kundenkommunikation (z. B. als Chatbot). Dem Tracing kommt hier eine wesentlich Bedeutung zu, da so komplette Chatverläufe nachvollzogen werden können. In diesem Vortrag beleuchte ich neue Werkzeuge, die uns helfen, den Einsatz von LLMs in Java Microservices zu überwachen. Ich stelle Langfuse als spezialisierte Tracinglösung vor und beleuchte, wie eigene Metriken in Langchain4j erhoben werden können. Ich zeige, wie aktuelle Verbrauchsmetriken z. B. von Google Gemini in Prometheus überführt werden können, um gezielt zu alarmieren. Ich zeige, wie wir verhindern, dass sensitive Daten im Tracing landen und wie wir Securityangriffe detailliert nachvollziehen können. Denn: Tracing und Security geht im speziellen Chatbot-Umfeld Hand in Hand.