PCA
Categoria
Fundamentos de IA
PCA (Analise de Componentes Principais) e a tecnica mais popular de reducao de dimensionalidade. Transforma features correlacionadas em componentes ortogonais que capturam a maxima variancia dos dados.
Categoria
Fundamentos de IA
O que e PCA?
PCA (Principal Component Analysis) e uma tecnica de reducao de dimensionalidade que transforma o conjunto original de features correlacionadas em um novo conjunto de variaveis nao-correlacionadas chamadas componentes principais, ordenadas pela quantidade de variancia que explicam.
Como Funciona
- Padroniza os dados (media zero, variancia unitaria)
- Calcula a matriz de covariancia
- Extrai autovetores e autovalores
- Seleciona os K componentes com maiores autovalores
- Projeta os dados no novo espaco
Aplicacoes
- Reducao de ruido em dados
- Compressao de dados e imagens
- Visualizacao de dados em 2D/3D
- Pre-processamento para outros algoritmos de ML
Consideracoes
PCA assume relacoes lineares entre variaveis. Para relacoes nao-lineares, alternativas como Kernel PCA ou Autoencoders sao mais adequadas. Na Trilion, PCA e uma ferramenta essencial no toolkit de analise exploratoria de dados.
