Hace poco vinieron a estudiar la agrupación en la minería de datos y he estudiado el agrupamiento secuencial y agrupamiento jerárquico y k-medias.preguntas sobre los métodos de agrupamiento
También leí sobre una afirmación que distingue k-means de las otras dos técnicas de agrupamiento, diciendo que k-means no es muy bueno para tratar con atributos nominales, pero el texto no explica este punto. Hasta ahora, el única diferencia que puedo ver es que para K-means, vamos a saber de antemano que necesitaremos exactamente K grupos, mientras que no sabemos cuántos grupos que necesitamos para otros dos métodos de agrupación.
Entonces, ¿alguien podría darme una idea aquí sobre por qué existe tal enunciado, es decir, k-means tiene este problema cuando se trata de ejemplos de atributos nominales y existe una forma de superar esto?
Gracias de antemano.
Tenga en cuenta que normalmente tomamos el valor mayoría de la variable discreta en el cálculo de los centroides de grupo. – Amro