Me doy cuenta de que un usuario de SO ha pedido este question pero se me preguntó en 2009 y esperaba tener más conocimientos de HDF5 o versiones más recientes que resolvieran este problema en particular. Para replantear la pregunta aquí con respecto a mi propio problema;Eliminación de información de un archivo HDF5
Tengo un archivo gigantesco de nodos y elementos de una gran geometría y ya he recuperado toda la información útil que necesito de él. Por lo tanto, en Python, intento mantener el archivo original, pero elimino la información que no necesito y complete más información para otras fuentes. Por ejemplo, tengo un conjunto de datos de nodos que no necesito. Sin embargo, debo mantener el conjunto de datos vecinos e incluir información sobre sus índices a partir de un archivo externo. ¿Hay alguna forma de eliminar estos conjuntos de datos específicos?
¿O la antigua idea de tener "placekeepers" en el archivo HDF5 sigue siendo cierta, de modo que nadie sabe cómo/molesta con la eliminación de información? No estoy demasiado preocupado por el espacio vacío, siempre y cuando sea más rápido simplemente eliminar y agregar información para crear un archivo completamente nuevo.
Nota: Estoy usando H5py's 'r +' para leer y escribir.
¡Muchas gracias por la explicación detallada y los enlaces útiles! Esto es exactamente lo que necesitaba. – Ason
Gracias. Este sigue siendo el caso. Explorado/confirmado programáticamente [aquí] (https://github.com/jackdotwa/python-concepts/blob/master/hdf5/reclaiming_space.ipynb). –