2012-07-13 24 views
5

Aquí es pequeño conjunto de datos:une todos los puntos (posible conbination) en gráfico de dispersión

myd <- data.frame(PC1 = rnorm(5, 5, 2), 
PC2 = rnorm (5, 5, 3), label = c("A", "B", "C", "D", "E")) 
plot(myd$PC1, myd$PC2) 
text(myd$PC1-0.1, myd$PC2, lab = myd$label) 

Quiero conectar todas las combinaciones posibles entre la línea con (euclidiana) distancia recta, para producir algunos gráfico como este (preferiblemente en la base de gráficos o ggplot2)

enter image description here

Respuesta

6

Aquí está la solución trama de base:

plot(myd$PC1, myd$PC2) 
apply(combn(seq_len(nrow(myd)), 2), 2, 
     function(x) lines(myd[x, ]$PC1, myd[x, ]$PC2)) 

enter image description here

Aquí está la solución ggplot2:

ps <- data.frame(t(apply(combn(seq_len(nrow(myd)), 2), 2, 
         function(x) c(myd[x, ]$PC1, myd[x, ]$PC2)))) 
qplot(myd$PC1, myd$PC2) + 
    geom_segment(data = ps, mapping = aes(x = X1, xend = X2, y = X3,yend = X4)) 

enter image description here

2

En ggplot puede utilizar geom_segment para dibujar las líneas de conexión.

Pero primero debe construir un marco de datos con las coordenadas de cada línea de conexión. Utilice combn() para encontrar todas las combinaciones:

comb <- combn(nrow(myd), 2) 
connections <- data.frame(
    from = myd[comb[1, ], 1:2], 
    to = myd[comb[2, ], 1:3] 
) 
names(connections) <- c("x1", "y1", "x2", "y2", "label") 

Entonces parcela:

library(ggplot2) 

ggplot(myd, aes(PC1, PC2)) + 
    geom_point(col="red", size=5) + 
    geom_segment(data=connections, aes(x=x1, y=y1, xend=x2, yend=y2), col="blue") 

enter image description here

Cuestiones relacionadas