Tengo un data.frame con 1,000 filas y 3 columnas. Contiene una gran cantidad de duplicados y he utilizado plyr para combinar las filas duplicadas y agregar un recuento para cada combinación como se explica en this thread.Busque y combine filas duplicadas en un data.frame pero ignore el orden de las columnas
He aquí un ejemplo de lo que tengo ahora (todavía tengo también la hoja.de.datos original con todos los duplicados si tengo que empezar desde allí):
name1 name2 name3 total
1 Bob Fred Sam 30
2 Bob Joe Frank 20
3 Frank Sam Tom 25
4 Sam Tom Frank 10
5 Fred Bob Sam 15
Sin embargo, orden de las columnas no lo hace importar. Solo quiero saber cuántas filas tienen las mismas tres entradas, en cualquier orden. ¿Cómo puedo combinar las filas que contienen las mismas entradas, ignorando el orden? En este ejemplo, quisiera combinar las filas 1 y 5, y las filas 3 y 4.
Esto también funcionó (después de eliminar espacios de las entradas de data.frame). También elimina el paso de copiar/pegar datos manualmente. Sin embargo, esto me deja con: 'nombre1 nombre2 nombre3 de búsqueda total de newtotal' 1 Bob Fred Sam 30 Bob ~ ~ Fred Sam 45 2 Bob Joe Frank 20 Bob ~ ~ Frank Joe 20 3 Frank Sam Tom Frank 25 ~ Sam ~ Tom 35' – jdfinch3
Hmmm, no se puede obtener el bloque de código para trabajar en los comentarios ... sin embargo, ee muestra los resultados combinados sin los totales actualizados y luego junto a los resultados combinados con los totales actualizados (y con ~ reemplazo las pestañas entre las entradas de fila). Estoy seguro de que esta es una solución fácil, pero no sé lo suficiente R (aún) para arreglarlo fácilmente ... – jdfinch3
De acuerdo, en realidad tomé el tiempo para leer su código y pensar cada acción y me di cuenta de que la respuesta a mi pregunta era aún más obvia de lo que había pensado. Acabo de tomar las dos nuevas columnas y las inserté en un nuevo data.frame (y reemplacé el "~" con "" solo para que sea más fácil de leer). ¡Gracias! – jdfinch3