Indholdsfortegnelse:
Definition - Hvad betyder K-Means Clustering?
K-betyder clustering er en simpel uovervåget indlæringsalgoritme, der bruges til at løse problemer med clustering. Det følger en simpel procedure til klassificering af et givet datasæt i et antal klynger, defineret af bogstavet "k", som er fastlagt på forhånd. Klyngerne placeres derefter som punkter, og alle observationer eller datapunkter er knyttet til den nærmeste klynge, beregnet, justeret, og derefter starter processen igen ved hjælp af de nye justeringer, indtil et ønsket resultat er nået.
K-betyder clustering har brug i søgemaskiner, markedssegmentering, statistik og endda astronomi.
Techopedia forklarer K-Means Clustering
K-betyder clustering er en metode, der bruges til clustering-analyse, især i data mining og statistik. Det sigter mod at opdele et sæt observationer i et antal klynger (k), hvilket resulterer i opdelingen af dataene i Voronoi-celler. Det kan betragtes som en metode til at finde ud af, hvilken gruppe et bestemt objekt virkelig hører til.
Det bruges hovedsageligt i statistikker og kan anvendes til næsten enhver gren af undersøgelsen. I marketing kan det f.eks. Bruges til at gruppere forskellige demografier af mennesker i enkle grupper, der gør det lettere for marketingfolk at målrette mod. Astronomer bruger det til at sile igennem enorme mængder astronomiske data; da de ikke kan analysere hvert objekt en ad gangen, har de brug for en måde at statistisk finde interessante seværdigheder til observation og undersøgelse.
Algoritmen:
- K-punkter placeres i objektdataområdet, der repræsenterer den indledende gruppe af centroider.
- Hvert objekt eller datapunkt tildeles i det nærmeste k.
- Når alle objekter er tildelt, beregnes k centroids positioner igen.
- Trin 2 og 3 gentages, indtil centroidenes positioner ikke længere bevæger sig.