Cross-Validation
Categoria
Fundamentos de IA
Cross-Validation é uma técnica de avaliação de modelos que divide os dados em K partes, treinando é testando K vezes para obter uma estimativa robusta do desempenho. O mais comum é o K-Fold com K=5 ou K=10.
Categoria
Fundamentos de IA
O que é Cross-Validation?
Cross-Validation (Validacao Cruzada) é uma técnica estatística usada para avaliar a capacidade de generalização de um modelo de ML. Em vez de dividir os dados em apenas um conjunto de treino é teste, os dados sao divididos em K partes (folds) é o modelo é treinado é avaliado K vezes.
K-Fold Cross-Validation
- Dados sao divididos em K partes iguais
- Em cada iteracao, uma parte é usada para teste é K-1 para treino
- O desempenho final é a media das K avaliações
- Valores comuns: K=5 ou K=10
Variantes
- Stratified K-Fold: mantem proporcao das classes em cada fold
- Leave-One-Out (LOO): K = número de amostras
- Time Series Split: respeita ordem temporal dos dados
Beneficios
A cross-validation fornece uma estimativa mais confiavel é menos enviesada do desempenho do modelo, sendo essêncial para comparação justa entre algoritmos. Na Trilion, cross-validation é prática obrigatoria antes de colocar qualquer modelo em produção.
