Pular para conteúdo

Projeto 07 - O Caçador de Overfitting 🕵️‍♂️

Neste projeto, você vai ver o Overfitting acontecer na prática e aprenderá a detectá-lo usando gráficos.

🎯 Objetivo

Visualizar a curva de erro de treino e teste para identificar o momento exato em que o modelo começa a "decorar".

🛠️ Ferramentas

  • Google Colab.
  • Bibliotecas: Scikit-Learn e Matplotlib.

📝 Passo a Passo

  1. Simulação de Dados: Crie um dataset pequeno com muito "ruído" (dados que não seguem um padrão perfeito).

  2. O Experimento:

    • Treine um modelo de Regressão Polinomial (ou uma Árvore de Decisão profunda).
    • Calcule o erro no Conjunto de Treino.
    • Calcule o erro no Conjunto de Teste.
  3. Análise Gráfica:

    • Se a curva de treino continua descendo mas a de teste começa a subir, parabéns: você encontrou o Overfitting!
  4. A Solução:

    • Tente simplificar o modelo (diminuir a profundidade ou o grau) e veja se as curvas se aproximam.

✅ Critérios de Entrega

  • Um gráfico simples mostrando as duas curvas (Erro de Treino vs Erro de Teste).
  • Indicação (via texto no notebook) de qual configuração do modelo gerou o melhor equilíbrio.

Importante

O objetivo de um cientista de dados não é o erro zero, mas o erro que se mantém estável em novos dados!