PCA
Categoria
Fundamentos de IA
PCA (Analise de Componentes Principais) é a técnica mais popular de redução de dimensionalidade. Transforma features correlacionadas em componentes ortogonais que capturam a máxima variancia dos dados.
Categoria
Fundamentos de IA
O que é PCA?
PCA (Principal Component Analysis) é uma técnica de redução de dimensionalidade que transforma o conjunto original de features correlacionadas em um novo conjunto de variaveis não-correlacionadas chamadas componentes principais, ordenadas pela quantidade de variancia que explicam.
Como Funciona
- Padroniza os dados (media zero, variancia unitaria)
- Calcula a matriz de covariancia
- Extrai autovetores é autovalores
- Seleciona os K componentes com maiores autovalores
- Projeta os dados no novo espaço
Aplicacoes
- Reducao de ruido em dados
- Compressao de dados é imagens
- Visualizacao de dados em 2D/3D
- Pre-processamento para outros algoritmos de ML
Consideracoes
PCA assume relações lineares entre variaveis. Para relações não-lineares, alternativas como Kernel PCA ou Autoencoders sao mais adequadas. Na Trilion, PCA é uma ferramenta essêncial no toolkit de análise exploratoria de dados.
