2011-04-29 7 views
5

He escrito el siguiente código:ggplot2 geom_line() debe apuntar en un valor especificado

library(ggplot2) 

data <- structure(list(x = c(1L, 6L, 3L, 4L, 2L, 3L, 6L, 1L, 5L, 2L, 
        1L, 5L), y = c(1L, 7L, 5L, 6L, 3L, 4L, 6L, 2L, 5L, 6L, 5L, 2L 
      ), year = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 
          2L, 2L), .Label = c("2010", "2011"), class = "factor"), matching = structure(c(1L, 
          2L, 3L, 4L, 5L, 6L, 1L, 2L, 3L, 4L, 5L, 6L), .Label = c("person1", 
          "person2", "person3", "person4", "person5", "person6"), class = "factor")), .Names = c("x", 
      "y", "year", "matching"), row.names = c(NA, -12L), class = "data.frame") 

data$year <- factor(data$year) 

colors <- c("#4cb5ee", "#a0d099", "red") 

p <- ggplot(data, aes(x=x, y=y)) + 
    geom_point(aes(colour=year), shape=16, size=6) + 
    geom_line(aes(group=matching), arrow=arrow(length=unit(0.15,"cm")), colour="black", size=1) + 
    xlab("x") + ylab("y") + 
    scale_colour_manual("year", values=colors) + 
    scale_x_continuous(limits=c(1,7), breaks=seq(1,7, by=1)) + 
    scale_y_continuous(limits=c(1,7), breaks=seq(1,7, by=1)) 

print(p) 

Se da el siguiente resultado: plot

Pero lo que quiero geom_line() que hacer es: siempre apunta al punto donde año = 2011. No puedo entender por qué la flecha de la línea se señala a veces en un punto que se refiere al año = 2010 y, a veces, apunta a un punto donde año = 2011.

Lo que descubrí es que la flecha requiere varios argumentos:

arrow(angle = 30, length = unit(0.25, "inches"), ends = "last", type = "open") 

Así que podría decir ends="first". Pero no puedo generalizar que ends es siempre first o siempre last.

Intenté agregar una columna a mi data.frame que tiene la información si la flecha debe terminar primero o el último, pero no me dio la salida que quería.

Cada ayuda es muy apreciada :-)

Gracias de antemano!

Respuesta

9

geom_path debe hacer el truco:

p <- ggplot(data, aes(x=x, y=y)) + 
    geom_point(aes(colour=year), shape=16, size=6) + 
    geom_path(aes(group=matching), 
        arrow=arrow(length=unit(0.15,"cm")), 
        colour="black", size=1) + 
    xlab("x") + ylab("y") + 
    scale_colour_manual("year", values=colors) + 
    scale_x_continuous(limits=c(1,7), breaks=seq(1,7, by=1)) + 
    scale_y_continuous(limits=c(1,7), breaks=seq(1,7, by=1)) 

print(p) 

geom_path plot

+0

Esta es una solución mejor. El enfoque que expuse puede ofrecer cierta flexibilidad para situaciones más complejas, pero esto es más adecuado para la tarea en cuestión. – Chase

+1

Pegúenme a eso. Supongo que necesito estar satisfecho de que yo (un usuario no ggplot) lo compilé a partir de la ayuda en línea. –

+0

Gracias por su solución, es realmente fácil ;-) –

4

es probable que haya una manera más eficiente de hacer esto, pero uno de los enfoques es utilizar geom_segment() en lugar de geom_line(). Esto le permitirá especificar los puntos de inicio y final de la línea con facilidad. Tenemos que reestructurar los datos para que podamos especificar x, y, xend y yend. Me reestructuraré con fusión, aunque probablemente podrías hacer esto con yeso o remodelación.

zz <- merge(data[data$year == 2010 ,], data[data$year == 2011 ,] 
    , by = "matching", suffixes = 1:2) 

    matching x1 y1 year1 x2 y2 year2 
1 person1 1 1 2010 6 6 2011 
2 person2 6 7 2010 1 2 2011 
3 person3 3 5 2010 5 5 2011 
4 person4 4 6 2010 2 6 2011 
5 person5 2 3 2010 1 5 2011 
6 person6 3 4 2010 5 2 2011 

Vamos a continuación, utilizamos dos conjuntos de datos en nuestro llamado a ggplot:

ggplot() +              #Blank call to ggplot 
    geom_point(data = data, aes(x=x, y=y, colour=year), shape=16, size=6) + #Points 
    geom_segment(data = zz, aes(x = x1, y = y1, xend = x2, yend = y2),   #Segments 
    arrow = arrow(length = unit(0.15, "cm")), colour = "black", size = 1) + 
    xlab("x") + ylab("y") + 
    scale_colour_manual("year", values=colors) + 
    scale_x_continuous(limits=c(1,7), breaks=seq(1,7, by=1)) + 
    scale_y_continuous(limits=c(1,7), breaks=seq(1,7, by=1)) 
+0

¡Gracias por su trabajo! En mi caso, necesito la solución rcs publicada, porque no quiero reestructurar los datos. Pero tienes razón, esto es bueno para situaciones complejas :-) –

Cuestiones relacionadas