Estoy interesado en realizar clusters de kmeans en una lista de palabras con Leveshtein como medida de distancia.palabras en clúster de Python KMeans
1) Sé que hay una gran cantidad de marcos por ahí, incluyendo scipy y naranja que tiene una aplicación kmeans. Sin embargo, todos requieren algún tipo de vector como datos que realmente no me quedan.
2) Necesito una buena implementación de la agrupación. Miré el clúster python y me di cuenta de que no a) devuelve la suma de toda la distancia a cada centroide, yb) no tiene ningún tipo de límite de iteración o corte que garantice la calidad de la agrupación. el clúster de pitón y el algoritmo de agrupación en daniweb no funcionan para mí.
¿Alguien puede encontrarme una buena lib? Google no ha sido mi amigo
Necesitaría exactamente lo mismo. ¿Has encontrado algo desde entonces? – Jabba