Consiste en agrupar individuos en grupos parecidos.
En la nube de puntos que forman los individuos…
Una variación del K-Means es el Fast K-means, en el paso 2 cada vez que enlazasemos con un centro de gravedad crearíamos otro nuevo. En una sola pasada se encuentran las clasificaciones pero son peores.
Consiste en ir agrupando individuos por cercanía y mostrándolos en un endograma (una especie de árbol\histograma).
Iremos creando el árbol, siendo la altura de estos nuevos nodos la distancia (al cuadrado) entre la pareja que los forma.
En el árbol estará todo el historial de agregaciones.
Al final tendremos un árbol donde se verá cláramente las clases (y se podrán escoger) que lo forman. Por ejemplo, en el siguiente podríamos escoger dos grupos ([1 3 4] y [2 5]) o tres ([1 3], [4] y [2 5]).
Existen varios criterios para unir nodos:
Inercia_Between / Inercia_Total, se buscará hacer la inercia between grande y la within pequeña.