Tengo problemas para almacenar una csr_matrix numpy con PyTables. Estoy recibiendo este error:Almacenamiento de la matriz numpy dispersa en HDF5 (PyTables)
TypeError: objects of type ``csr_matrix`` are not supported in this context, sorry; supported objects are: NumPy array, record or scalar; homogeneous list or tuple, integer, float, complex or string
Mi código:
f = tables.openFile(path,'w')
atom = tables.Atom.from_dtype(self.count_vector.dtype)
ds = f.createCArray(f.root, 'count', atom, self.count_vector.shape)
ds[:] = self.count_vector
f.close()
¿Alguna idea?
Gracias
¿Le preocupa el tamaño de los datos en el disco? Creo que los archivos hdf5 pueden almacenarse en formato comprimido, en cuyo caso puede salirse con la suya simplemente almacenando la matriz densa. – user545424
Ver http://stackoverflow.com/questions/8895120/using-pytables-which-is-more-efficient-scipy-sparse-or-numpy-dense-matrix, parece que no hay compatibilidad con las tablas para las matrices dispersas. – user545424