Aula 13 - Testes e Validação 🧪
Garantindo a Qualidade dos seus Agentes
Agenda de Hoje 📅
- Pirâmide de Testes para MCP
- Testes Unitários de Ferramentas
- Mocking de Clientes e Redes
- Testes de IA (Evals)
- Monitoramento de Saúde (Metrics)
1. A Camada de Testes 🏗️
- O código funciona? (Unitário).
- A comunicação JSON-RPC está correta? (Integração).
- A IA usa a ferramenta certo? (Evals).
2. Testes Unitários (Jest/PyTest)
- Rápido, barato e essencial.
3. Usando o MCP Inspector 🔍
- Simular chamadas manuais.
- Validar o Handshake.
- Verificação de Schemas JSON.
4. O que são Evals? 🤖
- Testes de comportamento do modelo.
- "Se o usuário diz X, a IA deve chamar Tool Y?".
- Medem a precisão probabilística.
5. Fluxo de Validação
graph TD
A[Código do Servidor] --> B[Testes Unitários]
B --> C[MCP Inspector]
C --> D[Evals com IA]
D --> E[Produção]
6. Mocking do Servidor 🎭
- Testar o Cliente sem precisar do servidor real.
- Útil para testar interfaces web (Aula 10).
7. Prática: Validando o Trigger
$ prompt-eval "Quanto custa o dólar?"
[RESULT] IA chamou 'get_stock' (ERRO)
[RESULT] IA chamou 'get_currency' (SUCESSO)
8. Monitoramento e Saúde
- Heartbeat: "O servidor ainda responde?".
- Error Rate: Porcentagem de falhas.
9. Logs de Depuração (Stderr)
- Diferencie logs de dados.
- Ajuda a encontrar bugs "na vida real".
10. Resumo ✅
- Teste a lógica primeiro.
- Use o Inspetor para o protocolo.
- Use Evals para a inteligência.
11. Mini-Projeto: Minha Primeira Suíte
- Escrever 3 casos de teste para uma ferramenta.
12. Dúvidas? 🤔
"Código não testado é código quebrado."