Es posible obtener los mismos clústeres kmeans para cada ejecución para un conjunto de datos en particular. Al igual que para un valor aleatorio, podemos usar una semilla fija. ¿Es posible detener la aleatoriedad para la agrupación?k-means: los mismos clústeres para cada ejecución
Respuesta
Sí, al llamar al set.seed(foo)
inmediatamente antes de ejecutar kmeans(....)
dará el mismo inicio aleatorio y, por lo tanto, el mismo agrupamiento cada vez. foo
es una semilla, como 42
o algún otro valor numérico.
Sí. Use set.seed
para establecer una semilla para el valor aleatorio antes de realizar la agrupación.
Usando el ejemplo de kmeans
:
set.seed(1)
x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 2),
matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 2))
colnames(x) <- c("x", "y")
set.seed(2)
XX <- kmeans(x, 2)
set.seed(2)
YY <- kmeans(x, 2)
prueba de la igualdad:
identical(XX, YY)
[1] TRUE
+1 para el ejemplo –
¡Gracias a un millón por esto, gran ayuda! Por favor acepta OP. – slotishtype
- 1. Los mismos números aleatorios cada iteración de bucle
- 2. Capistrano no reinicia correctamente los clústeres Mongrel
- 3. Múltiples espejos Maven para los mismos repositorios
- 4. ¿Cuándo usa los clústeres de tabla?
- 5. Borde recto entre los clústeres en Graphviz
- 6. pedidos puntos agruparon utilizando Kmeans y R
- 7. cv2.kmeans en Python
- 8. Markov algoritmo de clústeres de
- 9. Matriz de entrada a opencv kmeans clustering
- 10. Obteniendo el índice del punto de datos más cercano a los centríodos en la agrupación de Kmeans en MATLAB
- 11. GraphViz, agrupando los mismos bordes
- 12. Random.Next devuelve siempre los mismos valores
- 13. Disqus Cargando los mismos comentarios para las páginas dinámicas
- 14. Registrar cada ejecución de método
- 15. Node.js for() loop que devuelve los mismos valores en cada bucle
- 16. palabras en clúster de Python KMeans
- 17. Java 7: ThreadLocalRandom que genera los mismos números aleatorios
- 18. ¿Deberían los clústeres hadoop ejecutarse en un hardware idéntico?
- 19. de ejecución para cada archivo en el directorio
- 20. Comprobar cadenas para los mismos caracteres en Objective-C
- 21. Excel fórmula - suma de automóviles para los mismos tipos
- 22. Compruebe todos los valores en una matriz son los mismos
- 23. Partición en clases: jenks vs kmeans
- 24. ¿clearTimeout y clearInterval son los mismos?
- 25. ¿Hay alguna manera de devolver los mismos datos para cada acción ASP.Net MVC en un controlador en particular?
- 26. C# código de ejecución cada 30 días
- 27. http_build_query con los mismos parámetros de nombre
- 28. ¿Cómo obtener los mismos valores de HashMap?
- 29. gama Llenar MATLAB con los mismos valores
- 30. Comprueba si dos elementos son los mismos
sólo tiene que añadir a la respuesta Andrie y de Gavin, he probado que incluso cuando nos fijamos el argumento 'nstart' en el kmeans() mayor que 1, es decir, que tiene múltiples iteraciones de siembra aleatoria, set.seed() obtendrá resultados idénticos producibles. –