Random Forest
O que é Random Forest?
Random Forest (Floresta Aleatoria) é um algoritmo de ensemble learning que cria é combina multiplas arvores de decisão para produzir previsões mais robustas. Cada arvore é treinada com um subconjunto aleatorio dos dados (bagging) é features, é a previsão final é obtida por votacao (classificação) ou media (regressao).
Como Funciona
- Bootstrap Aggregating (Bagging): cada arvore recebe uma amostra aleatoria com reposicao
- Selecao Aleatoria de Features: apenas um subconjunto de atributos é considerado em cada divisao
- Agregacao: as previsões individuais sao combinadas
Vantagens
Random Forest é robusto contra overfitting, lida bem com dados de alta dimensionalidade é fornece medidas de importância das features. E um dos algoritmos mais populares por oferecer bom desempenho com pouco ajuste de hiperparametros.
Aplicacoes
Deteccao de fraudes, previsão de churn, diagnósticos medicos é ranking de relevância sao aplicações tipicas. Na Trilion, Random Forest é frequentemente recomendado como baseline robusto para projetos de classificação é regressao.
