Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Luccas Quadros: Além do tail -f: Análise inteli...

DevOpsDays Floripa
November 13, 2023
55

Luccas Quadros: Além do tail -f: Análise inteligente de logs para detecção de anomalias

Palestra realizada no DevOpsDays Florianópolis 2023

DevOpsDays Floripa

November 13, 2023
Tweet

More Decks by DevOpsDays Floripa

Transcript

  1. Luccas Quadros Engenheiro de Software Sr. AI/ML Além do tail

    -f: Análise inteligente de logs para detecção de anomalias
  2. Logs na era da cibernética https://brandur.org/logfmt - Primeira documentação de

    logfmt logfmt Em geral, as documentações e os padrões para se escrever logs são escassos. Cabe ao desenvolvedor definir: O que, como e quando.
  3. Linguagem natural? é difícil extrair informações importantes do conteúdo da

    mensagem porque ele é escrito principalmente por desenvolvedores em linguagem natural de formato livre.¹ 1.He, Shilin, et al. "A survey on automated log analysis for reliability engineering." É possível utilizar técnicas de NLP? ?
  4. Transformar logs em informações valiosas Logs Grupos Templates Constantes Padrões

    Variáveis No mundo do NLP isso seria como tokenizar e limpar o texto
  5. Desafios ⬆ Grande volume de logs ❓ Diversidade de formatos

    e templates 🚀 Em constante mudança Criar scripts manuais, regexes mirabolantes e utilizar soluções focadas em tipos específicos de logs não são o suficiente pro mundo dos micro serviços e o desenvolvimento de software moderno.
  6. Escolha o seu algoritmo 1.He, Shilin, et al. "A survey

    on automated log analysis for reliability engineering."
  7. Minerar logs, gostoso demais! 1.He, Shilin, et al. "A survey

    on automated log analysis for reliability engineering."
  8. Diferentes algoritmos 1.He, Shilin, et al. "A survey on automated

    log analysis for reliability engineering."
  9. Boas features geram bons modelos 📊 Contagem de grupos (constantes)

    ❓ Contagem de parametros (variáveis) ⏩ Sequencia de grupos (constantes) 🪄 Ad-hoc Features
  10. Grafana Alerting Grafana OnCall Grafana Incident O diagrama de um

    Incidente Parsear Logs Descobrir os grupos Identificar anomalias Logs úteis em uma investigação
  11. Receita de bolo Query Comparar: Última 1h X Passado .txt

    - Capturar logs - Descobrir os templates de erro - Qual o comportamento deste erro? - ✨✨Resultado✨✨
  12. Próximos passos 👀 Sift Investigations está em Public Preview 󰷺

    Sequências estranhas 📈 Algoritmos sofisticados de Detecção 🫣 Tempo real?