Nesta palestra, apresento uma arquitetura multi-layer para query understanding, onde o desafio foi equilibrar legados robustos com performance em tempo real e integrações de Machine Learning. O desenho incluiu uso de cache inteligente, fallback entre camadas e pipelines near-realtime para enriquecer consultas com features complexas.