Los k-medoids en la clara() función utiliza la distancia para formar racimos por lo que obtener este patrón:¿Cómo agrupar por tendencia en lugar de por distancia en R?
a <- matrix(c(0,1,3,2,0,.32,1,.5,0,.35,1.2,.4,.5,.3,.2,.1,.5,.2,0,-.1), byrow=T, nrow=5)
cl <- clara(a,2)
matplot(t(a),type="b", pch=20, col=cl$clustering)
Pero yo quiero encontrar un método de agrupamiento que asigna un clúster para cada línea de acuerdo con su tendencia, entonces las líneas 1, 2 y 3 pertenecen a un grupo y las líneas 4 y 5 a otro.
¿Es esto diferente de lo que @joran ha propuesto? Puede que no vea la diferencia – nachocab
Habiendo leído su respuesta: no, no es sustancialmente diferente. Estoy sugiriendo una escala diferente. Sin embargo, el punto clave que quería señalar es que esto pertenece al paso importante de preprocesamiento que no debe descuidar. Es por eso que siempre se habla mucho sobre el proceso de KDD: https://en.wikipedia.org/wiki/Data_mining#Process Es el 90% del esfuerzo en la minería real, es como máximo el 5% de los resultados científicos, que centrarse en nuevos algoritmos. –