Me sorprendió descubrir que clara
de permite NA. Pero la documentación de la función no dice nada sobre cómo maneja estos valores.agrupamiento con valores NA en R
Así que mis preguntas son:
- Cómo maneja
clara
AN? - ¿Se puede utilizar esto de alguna manera para
kmeans
(Nas no permitido)?
[Actualización] líneas Así que lo hicieron se encontraron de código en función clara
:
inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat
que no faltan reemplazo de valor por valmisdat
. No estoy seguro de entender el motivo para usar dicha fórmula. ¿Algunas ideas? ¿Sería más "natural" tratar NA por cada columna por separado, quizás reemplazando con media/mediana?
Mismas líneas de código para tratar los valores perdidos en 'daisy' que en la función' clara' (ver la actualización de mi pregunta). –
@ danas.zuokas No estoy seguro de cuán útil es extraer líneas arbitrarias de código de las fuentes que usted cree que están relacionadas con la pregunta. Necesita estudiar tanto el código R como el código C. 'valmisdat' es el valor utilizado para indicar datos faltantes (' NA') en el código C en lugar de hacer que use 'NA' directamente. Si observa el código C, verá que claramente ignora las comparaciones en las que una variable tiene un valor faltante para una u otra o ambas muestras para las cuales se está computando la diferencia. Vea la respuesta actualizada para el puntero al código. –
¡Gracias, Gavin! –