Tengo un archivo de entrada con una lista de ~ 50000 clusters y presencia de varios factores en cada uno de ellos (~ 10 millones de entradas en total), consulte a ejemplo más pequeña a continuación:Diagrama de Venn de la lista de clústeres y factores concurrentes
set.seed(1)
x = paste("cluster-",sample(c(1:100),500,replace=TRUE),sep="")
y = c(
paste("factor-",sample(c(letters[1:3]),300, replace=TRUE),sep=""),
paste("factor-",sample(c(letters[1]),100, replace=TRUE),sep=""),
paste("factor-",sample(c(letters[2]),50, replace=TRUE),sep=""),
paste("factor-",sample(c(letters[3]),50, replace=TRUE),sep="")
)
data = data.frame(cluster=x,factor=y)
con un poco de ayuda de otra pregunta, lo tengo para producir un gráfico circular para la co-ocurrencia de factores como esto:
counts = with(data, table(tapply(factor, cluster, function(x) paste(as.character(sort(unique(x))), collapse='+'))))
pie(counts[counts>1])
Pero ahora me gustaría tener un diagrama de venn para la concurrencia de factores. Idealmente, también de una manera que puede tomar un umbral para el conteo mínimo para cada factor. Por ejemplo, un diagrama de venn para los diferentes factores para que cada uno de ellos tenga que estar presente n> 10 en cada grupo a tener en cuenta.
He intentado encontrar una manera de producir los recuentos de tablas con agregado, pero no pude hacerlo funcionar.
¿Has mirado en cualquiera de los paquetes de R para los diagramas de Venn? Ver [este ejemplo reciente] (http://stats.stackexchange.com/questions/16802/derive-pc-ab-from-coxs-two-rules/18209#18209) por G. Jay Kerns utilizando la biblioteca 'venneuler' , o este breve artículo en el Journal of Stat Software que usa la biblioteca 'venn' ([Murdoch, 2004] (http://www.jstatsoft.org/v11/c01)). Si esto es puramente sobre la programación R, debería migrarse a SO. –
Avilella, esta pregunta podría no obtener ninguna respuesta porque está marginalmente fuera del tema. Puede que le vaya mejor en SO, que tiene una comunidad de usuarios R activa. Pero, por favor, no publique mensajes cruzados: simplemente marque la pregunta para la atención del moderador si desea que se migre. – whuber
Lo he marcado, pero no puedo ver que se haya movido a SO aún ... – 719016