Projeto 07 - O Caçador de Overfitting 🕵️♂️
Neste projeto, você vai ver o Overfitting acontecer na prática e aprenderá a detectá-lo usando gráficos.
🎯 Objetivo
Visualizar a curva de erro de treino e teste para identificar o momento exato em que o modelo começa a "decorar".
🛠️ Ferramentas
- Google Colab.
- Bibliotecas: Scikit-Learn e Matplotlib.
📝 Passo a Passo
-
Simulação de Dados: Crie um dataset pequeno com muito "ruído" (dados que não seguem um padrão perfeito).
-
O Experimento:
- Treine um modelo de Regressão Polinomial (ou uma Árvore de Decisão profunda).
- Calcule o erro no Conjunto de Treino.
- Calcule o erro no Conjunto de Teste.
-
Análise Gráfica:
- Se a curva de treino continua descendo mas a de teste começa a subir, parabéns: você encontrou o Overfitting!
-
A Solução:
- Tente simplificar o modelo (diminuir a profundidade ou o grau) e veja se as curvas se aproximam.
✅ Critérios de Entrega
- Um gráfico simples mostrando as duas curvas (Erro de Treino vs Erro de Teste).
- Indicação (via texto no notebook) de qual configuração do modelo gerou o melhor equilíbrio.
Importante
O objetivo de um cientista de dados não é o erro zero, mas o erro que se mantém estável em novos dados!