KNN
Categoria
Fundamentos de IA
KNN (K-Nearest Neighbors) e um algoritmo de ML que classifica novos dados com base nos K vizinhos mais proximos. E simples, intuitivo e nao-parametrico, utilizado em classificacao e regressao.
Categoria
Fundamentos de IA
O que e KNN?
K-Nearest Neighbors (KNN) e um algoritmo de aprendizado supervisionado que classifica novos exemplos com base na similaridade com os K vizinhos mais proximos no espaco de features. E um algoritmo baseado em instancias (lazy learner), pois nao constroi um modelo explicito durante o treinamento.
Como Funciona
- Calcular a distancia entre o novo ponto e todos os pontos de treinamento
- Selecionar os K pontos mais proximos
- Para classificacao: votacao majoritaria
- Para regressao: media dos valores
Metricas de Distancia
As metricas mais usadas sao Euclidiana, Manhattan e Minkowski. A escolha de K e crucial: valores pequenos podem gerar overfitting, enquanto valores grandes podem causar underfitting.
Consideracoes
KNN e sensivel a escala dos dados (necessita normalizacao) e tem custo computacional alto para grandes conjuntos de dados. A Trilion utiliza KNN quando a interpretabilidade e simplicidade sao prioritarias em projetos de classificacao com datasets menores.
