que tienen una trama de datos con 900.000 filas y 11 columnas en R. Los nombres de columna y tipos son los siguientes:subtotales Cálculo de R
column name: date/mcode/mname/ycode/yname/yissue/bsent /breturn/tsent /treturn/csales
type: Date/Char/Char/Char/Char/Numeric/Numeric/Numeric/Numeric/Numeric/Numeric
quiero para calcular los subtotales. Por ejemplo, quiero calcular las sumas en cada cambio en yname, y agregar subtotal a todas las variables numéricas. Hay 160 ynames distintos, por lo que la tabla resultante debería decirme el subtotal de cada yname. Todavía no he ordenado los datos, pero esto no es un problema porque puedo ordenar los datos de la forma que quiera. Debajo hay un fragmento de mis datos:
date mcode mname ycode yname yissue bsent breturn tsent treturn csales
417572 2010-07-28 45740 ENDPOINT A 5772 XMAG 20100800 7 0 7 0 0
417573 2010-07-31 45740 ENDPOINT A 5772 XMAG 20100800 0 0 0 0 1
417574 2010-08-04 45740 ENDPOINT A 5772 XMAG 20100800 0 0 0 0 1
417575 2010-08-14 45740 ENDPOINT A 5772 XMAG 20100800 0 0 0 0 1
417576 2010-08-26 45740 ENDPOINT A 5772 XMAG 20100800 0 4 0 0 0
417577 2010-07-28 45741 ENDPOINT L 5772 XMAG 20100800 2 0 2 0 0
417578 2010-08-04 45741 ENDPOINT L 5772 XMAG 20100800 2 0 2 0 0
417579 2010-08-26 45741 ENDPOINT L 5772 XMAG 20100800 0 4 0 0 0
417580 2010-07-28 46390 ENDPOINT R 5772 XMAG 20100800 3 0 3 0 1
417581 2010-07-29 46390 ENDPOINT R 5772 XMAG 20100800 0 0 0 0 2
417582 2010-08-01 46390 ENDPOINT R 5779 YMAG 20100800 3 0 3 0 0
417583 2010-08-11 46390 ENDPOINT R 5779 YMAG 20100800 0 0 0 0 1
417584 2010-08-20 46390 ENDPOINT R 5779 YMAG 20100800 0 0 0 0 1
417585 2010-08-24 46390 ENDPOINT R 5779 YMAG 20100800 2 0 2 0 1
417586 2010-08-26 46390 ENDPOINT R 5779 YMAG 20100800 0 2 0 2 0
417587 2010-07-28 46411 ENDPOINT D 5779 YMAG 20100800 6 0 6 0 0
417588 2010-08-08 46411 ENDPOINT D 5779 YMAG 20100800 0 0 0 0 1
417589 2010-08-11 46411 ENDPOINT D 5779 YMAG 20100800 0 0 0 0 1
417590 2010-08-26 46411 ENDPOINT D 5779 YMAG 20100800 0 4 0 4 0
¿Qué función debo usar aquí? Tal vez algo como SQL group by
?
Sería mucho más fácil si nos dio un fragmento de datos o más detalles de lo que realmente quiere. Hay un cierto grado de ironía en su solicitud de ejemplos de nosotros cuando usted no proporciona uno. En serio, es muy probable que la mayoría de los R Gurus no usen Excel y probablemente no lo hayan hecho por mucho tiempo, así que no presumas que sabemos a qué te refieres cuando dices "hazlo como Excel". ¿'Yname' está ordenado? Porque entonces sería una tarea de agregación en R (es decir, desea las sumas del número para los grupos definidos por yname). –
@Gavin Simpson: He actualizado mi pregunta de acuerdo con su comentario. –
aquí hay algunas preguntas relacionadas: http://stackoverflow.com/search?q=%5Br%5D+%22group+by%22 –