🚀 Capítulo 14: Monitoramento e Logs (Tema: Exterminador do Futuro)
NOTE
Este capítulo utiliza a temática de Exterminador do Futuro para explicar o Monitoramento. Enxergue o mundo através de dados em tempo real e saiba exatamente o que está acontecendo com o seu sistema!
1. 🎯 Objetivo da Aula
Compreender a importância do Monitoramento e da coleta de Logs na cultura DevOps, conhecendo ferramentas como Prometheus e Grafana para visualizar a saúde do sistema em tempo real.
2. 🏢 O Cenário Prático (Seu Desafio)
O Exterminador (T-800) possui uma visão especial. Quando ele olha para o mundo, a tela fica vermelha e cheia de dados passando:
- A distância até o alvo.
- A velocidade do carro.
- A temperatura ambiente.
- O nível de bateria dele mesmo.
Ele não adivinha se está correndo rápido ou se a bateria vai acabar; ele vê os dados na tela em tempo real. No desenvolvimento de software, nós não podemos adivinhar se o site está rápido ou se o servidor vai cair. Nós precisamos programar a “visão do Exterminador” para o nosso sistema! Seu desafio é criar os gráficos de monitoramento!
🧠 Fundamentos: A Teoria Traduzida
No DevOps, nós dividimos a visão do sistema em duas partes principais:
📝 1. Logs (Os Registros do Passado):
- O que são: É o diário de bordo do sistema. Cada linha de texto diz algo que aconteceu.
- Exemplo:
[10:15:32] USUÁRIO Carlos fez login com sucesso.ou[10:15:35] ERRO: Banco de dados fora do ar. - Serve para investigar o que deu errado depois que o problema aconteceu.
📊 2. Métricas (Os Números do Presente):
- O que são: São números que mudam o tempo todo e mostram a saúde do sistema agora.
- Exemplo: Uso de CPU (80%), Memória livre (200 MB), Acessos por segundo (150).
- Serve para ver o problema acontecendo ao vivo ou prever que algo vai dar errado.
🤖 As Ferramentas Famosas:
- Prometheus: O robô que fica coletando os números (métricas) do servidor a cada segundo.
- Grafana: O programa que desenha os gráficos bonitos na tela (a visão do Exterminador), usando os dados que o Prometheus coletou.
4. 📖 Exemplo Guiado: O Dashboard do Grafana
Imagine uma tela cheia de gráficos na parede da empresa:
- Gráfico 1: Uma linha verde mostrando os acessos por segundo. Se a linha cair para zero, significa que o site caiu!
- Gráfico 2: Uma barra vermelha mostrando o uso de memória. Se chegar em 100%, o servidor vai travar.
- Gráfico 3: O tempo que o site demora para carregar (em milissegundos).
Se o tempo de carregamento começar a subir muito, a equipe DevOps vê o gráfico e age antes que o site caia de verdade!
5. 🛠️ Prática Obrigatória 1: Logs ou Métricas?
Diga se você deve olhar os Logs ou as Métricas em cada situação:
- Você quer saber quantas pessoas acessaram o seu site no total durante o dia de ontem.
- Um cliente ligou reclamando que a conta dele deu erro na hora de pagar. Você precisa descobrir qual foi a linha de código que deu erro para esse cliente específico.
- Você quer ver um gráfico em tempo real mostrando se o processador do servidor está sobrecarregado agora.
6. 🛠️ Prática Obrigatória 2: O Alerta Inteligente
Você configurou um alerta no Grafana: “Se o uso de CPU passar de 90% por mais de 5 minutos, envie uma mensagem no grupo do WhatsApp da equipe”.
- Qual a vantagem de ter um alerta automático em vez de deixar um funcionário olhando para a tela dos gráficos o dia todo?
7. 📤 Instruções de Entrega (GitHub Desktop + Microsoft Teams)
- Faça o Commit: No GitHub Desktop, digite a mensagem (ex:
Finaliza Capítulo 14 DevOps) e clique em Commit to main. - Envie para a Nuvem (Push): Clique em Push origin.
8. 📂 Estrutura de Pastas
mod_13_devops_e_cloud/
├── capitulos/
│ ├── capitulo_14_monitoramento.md
│ └── codigos/
│ └── cap14/
│ └── dashboard.json💡 Checkpoint de Lógica
Sem monitoramento, você está voando às cegas. Descobrir que o site caiu porque os clientes estão reclamando no Twitter é o pior pesadelo de uma equipe DevOps!
10. 🔥 Desafio de Fixação
Pesquise o que significa a sigla SLA (Service Level Agreement) e por que ela é importante para os clientes de empresas de tecnologia.
🔑 Gabarito de Código/Fórmulas
Gabarito da Prática 1:
- Métricas (Contagem de acessos).
- Logs (Rastrear o erro específico do usuário no histórico).
- Métricas (Dados numéricos em tempo real). Gabarito da Prática 2:
- O robô não cansa e não pisca. Ele vigia o sistema 24 horas por dia. Isso libera o funcionário humano para focar em programar ou resolver problemas reais, em vez de ficar apenas vigiando uma tela esperando algo dar errado.