KNN
Categoria
Fundamentos de IA
KNN (K-Nearest Neighbors) é um algoritmo de ML que classifica novos dados com base nos K vizinhos mais proximos. E simples, intuitivo é não-parametrico, útilizado em classificação é regressao.
Categoria
Fundamentos de IA
O que é KNN?
K-Nearest Neighbors (KNN) é um algoritmo de aprendizado supervisionado que classifica novos exemplos com base na similaridade com os K vizinhos mais proximos no espaço de features. E um algoritmo baseado em instancias (lazy learner), pois não constroi um modelo explicito durante o treinamento.
Como Funciona
- Calcular a distancia entre o novo ponto é todos os pontos de treinamento
- Selecionar os K pontos mais proximos
- Para classificação: votacao majoritaria
- Para regressao: media dos valores
Metricas de Distancia
As métricas mais usadas sao Euclidiana, Manhattan é Minkowski. A escolha de K é crucial: valores pequenos podem gerar overfitting, enquanto valores grandes podem causar underfitting.
Consideracoes
KNN é sensivel a escala dos dados (necessita normalização) é tem custo computacional alto para grandes conjuntos de dados. A Trilion útiliza KNN quando a interpretabilidade é simplicidade sao prioritarias em projetos de classificação com datasets menores.
