componentes envolvidos no Kubernetes, a solução de problemas pode ser complexa. • Para Entender o problema, precisamos reunir o máximo de informações possível sobre o problema. Isso inclui mensagens de erro, logs e o comportamento específico observado. Entender os sintomas e determinar se o problema está isolado em um aplicativo específico, nó ou está afetando todo o cluster ajuda a reduzir as possíveis causas.
do Kubernetes Certifique-se de que os serviços estão configurados corretam ente e que seus endpoints correspondentes estão disponíveis. 4 Investigue problem as de rede Faça testes de com unicação entre pods, verifique sua CN I, portas corretas expostas nos services, serviço DN S funcionando? 3 Exam ine a saúde do nó Um nó que não está "Ready" pode indicar problem as de rede, restrições de recursos ou outros problem as subjacentes. Verifique o status do pod kubectl get pods e kubectl describe pod <nom e-do-pod> 2 1 Entenda o problem a Obtenha a m aior quantidade de inform ação sobre o problem a para entendê-lo.
dois erros: Readiness probe failed: HTTP probe failed with statuscode: 500 e tls: failed to verify certificate: x509: cannot validate certificate for 172.18.0.X because it doesn't contain any IP SANs.
do container e obtive: E0203 21:19:19.051931 1 scraper.go:149] "Failed to scrape node" err="Get \"https://172.18.0.5:10250/metrics/resource\": tls: failed to verify certificate: x509: cannot validate certificate for 172.18.0.5 because it doesn't contain any IP SANs" node="kind-control-plane" • Ou seja, os logs me mostraram que havia um problema com a validação dos certificados TLS utilizados pelo kubelet. • Adicionei a flag --kubelet-insecure-tls, as probes funcionaram corretamente e o pod subiu. https://github.com/kubernetes-sigs/metrics-server/issues/1025
natureza distribuída do Kubernetes e a variedade de componentes envolvidos é preciso dividir o sistema em partes menores para identificar qual componente está falhando, reduzindo a complexidade da análise.