Estoy trabajando con datos de encuestas cargados desde un archivo h5 como hdf = pandas.HDFStore('Survey.h5')
mediante el paquete pandas. Dentro de este DataFrame
, todas las filas son el resultado de una sola encuesta, mientras que las columnas son las respuestas para todas las preguntas en una sola encuesta.Slice Pandas DataFrame por fila
Estoy tratando de reducir este conjunto de datos a un menor DataFrame
incluyendo solo las filas con una cierta respuesta representada en una determinada pregunta, es decir, con el mismo valor en esta columna. Puedo determinar los valores de índice de todas las filas con esta condición, pero no puedo encontrar cómo eliminar estas filas o crear una nueva df con estas filas solamente.
es posible cortar la trama de datos y decir (c = 5 o C = 6) de esta manera: ---> df [((df.A == 0) & (df.B == 2) & (df.C == 5 o 6) & (df.D == 0))] – yoshiserry
df [((df.A = = 0) & (df.B == 2) & df.C.isin ([5, 6]) & (df.D == 0))] o df [((df.A == 0) & (df.B == 2) & ((df.C == 5) | (df.C == 6)) & (df.D == 0))] –