🚀 Capítulo 14: Monitoramento e Logs (Tema: Exterminador do Futuro)

NOTE

Este capítulo utiliza a temática de Exterminador do Futuro para explicar o Monitoramento. Enxergue o mundo através de dados em tempo real e saiba exatamente o que está acontecendo com o seu sistema!


1. 🎯 Objetivo da Aula

Compreender a importância do Monitoramento e da coleta de Logs na cultura DevOps, conhecendo ferramentas como Prometheus e Grafana para visualizar a saúde do sistema em tempo real.

2. 🏢 O Cenário Prático (Seu Desafio)

O Exterminador (T-800) possui uma visão especial. Quando ele olha para o mundo, a tela fica vermelha e cheia de dados passando:

  • A distância até o alvo.
  • A velocidade do carro.
  • A temperatura ambiente.
  • O nível de bateria dele mesmo.

Ele não adivinha se está correndo rápido ou se a bateria vai acabar; ele vê os dados na tela em tempo real. No desenvolvimento de software, nós não podemos adivinhar se o site está rápido ou se o servidor vai cair. Nós precisamos programar a “visão do Exterminador” para o nosso sistema! Seu desafio é criar os gráficos de monitoramento!


🧠 Fundamentos: A Teoria Traduzida

No DevOps, nós dividimos a visão do sistema em duas partes principais:

📝 1. Logs (Os Registros do Passado):

  • O que são: É o diário de bordo do sistema. Cada linha de texto diz algo que aconteceu.
  • Exemplo: [10:15:32] USUÁRIO Carlos fez login com sucesso. ou [10:15:35] ERRO: Banco de dados fora do ar.
  • Serve para investigar o que deu errado depois que o problema aconteceu.

📊 2. Métricas (Os Números do Presente):

  • O que são: São números que mudam o tempo todo e mostram a saúde do sistema agora.
  • Exemplo: Uso de CPU (80%), Memória livre (200 MB), Acessos por segundo (150).
  • Serve para ver o problema acontecendo ao vivo ou prever que algo vai dar errado.

🤖 As Ferramentas Famosas:

  • Prometheus: O robô que fica coletando os números (métricas) do servidor a cada segundo.
  • Grafana: O programa que desenha os gráficos bonitos na tela (a visão do Exterminador), usando os dados que o Prometheus coletou.

4. 📖 Exemplo Guiado: O Dashboard do Grafana

Imagine uma tela cheia de gráficos na parede da empresa:

  1. Gráfico 1: Uma linha verde mostrando os acessos por segundo. Se a linha cair para zero, significa que o site caiu!
  2. Gráfico 2: Uma barra vermelha mostrando o uso de memória. Se chegar em 100%, o servidor vai travar.
  3. Gráfico 3: O tempo que o site demora para carregar (em milissegundos).

Se o tempo de carregamento começar a subir muito, a equipe DevOps vê o gráfico e age antes que o site caia de verdade!


5. 🛠️ Prática Obrigatória 1: Logs ou Métricas?

Diga se você deve olhar os Logs ou as Métricas em cada situação:

  1. Você quer saber quantas pessoas acessaram o seu site no total durante o dia de ontem.
  2. Um cliente ligou reclamando que a conta dele deu erro na hora de pagar. Você precisa descobrir qual foi a linha de código que deu erro para esse cliente específico.
  3. Você quer ver um gráfico em tempo real mostrando se o processador do servidor está sobrecarregado agora.

6. 🛠️ Prática Obrigatória 2: O Alerta Inteligente

Você configurou um alerta no Grafana: “Se o uso de CPU passar de 90% por mais de 5 minutos, envie uma mensagem no grupo do WhatsApp da equipe”.

  1. Qual a vantagem de ter um alerta automático em vez de deixar um funcionário olhando para a tela dos gráficos o dia todo?

7. 📤 Instruções de Entrega (GitHub Desktop + Microsoft Teams)

  1. Faça o Commit: No GitHub Desktop, digite a mensagem (ex: Finaliza Capítulo 14 DevOps) e clique em Commit to main.
  2. Envie para a Nuvem (Push): Clique em Push origin.

8. 📂 Estrutura de Pastas

mod_13_devops_e_cloud/
├── capitulos/
│   ├── capitulo_14_monitoramento.md
│   └── codigos/
│       └── cap14/
│           └── dashboard.json

💡 Checkpoint de Lógica

Sem monitoramento, você está voando às cegas. Descobrir que o site caiu porque os clientes estão reclamando no Twitter é o pior pesadelo de uma equipe DevOps!

10. 🔥 Desafio de Fixação

Pesquise o que significa a sigla SLA (Service Level Agreement) e por que ela é importante para os clientes de empresas de tecnologia.

🔑 Gabarito de Código/Fórmulas

Gabarito da Prática 1:

  1. Métricas (Contagem de acessos).
  2. Logs (Rastrear o erro específico do usuário no histórico).
  3. Métricas (Dados numéricos em tempo real). Gabarito da Prática 2:
  4. O robô não cansa e não pisca. Ele vigia o sistema 24 horas por dia. Isso libera o funcionário humano para focar em programar ou resolver problemas reais, em vez de ficar apenas vigiando uma tela esperando algo dar errado.

Capitulo Anterior | Proximo Capitulo