Indholdsfortegnelse:
Definition - Hvad betyder K-nærmeste nabo (K-NN)?
En k-nærmeste nabo-algoritme, ofte forkortet k-nn, er en tilgang til dataklassificering, der estimerer, hvor sandsynligt et datapunkt er at være medlem af en gruppe eller den anden afhængigt af hvilken gruppe datapunkter, der er tættest på det, er i .
K-nærmeste nabo er et eksempel på en "doven lærer" -algoritme, hvilket betyder, at den ikke bygger en model ved hjælp af træningssættet, før en forespørgsel fra datasættet udføres.
Techopedia forklarer K-Nærmeste nabo (K-NN)
En k-nærmeste nabo er en dataklassificeringsalgoritme, der forsøger at bestemme, hvilken gruppe et datapunkt er i ved at se på datapunkterne omkring det.
En algoritme, der ser på et punkt på et gitter og prøver at bestemme, om et punkt er i gruppe A eller B, ser på tilstande for de punkter, der er i nærheden af det. Området bestemmes vilkårligt, men pointen er at tage en prøve af dataene. Hvis størstedelen af punkterne er i gruppe A, er det sandsynligt, at det pågældende datapunkt er A snarere end B, og vice versa.
K-nærmeste nabo er et eksempel på en "doven lærer" -algoritme, fordi den ikke genererer en model for datasættet på forhånd. De eneste beregninger, den foretager, er, når det bliver bedt om at afstemme datapunktets naboer. Dette gør k-nn meget let at implementere til data mining.
