Por lo tanto, estoy haciendo una clasificación de Kmeans usando matrices numpy que son bastante dispersas-- montones y montones de ceros. Pensé que usaría el paquete 'disperso' de scipy para reducir la sobrecarga de almacenamiento, pero estoy un poco confundido acerca de cómo crear matrices, no matrices.Scipy sparse ... matrices?
He pasado por este tutorial sobre cómo crear matrices dispersas: http://www.scipy.org/SciPy_Tutorial#head-c60163f2fd2bab79edd94be43682414f18b90df7
para imitar una matriz, que simplemente creo una matriz 1xN, pero como pueden suponer, Asp.dot (BSP) doesn' Trabaja bastante porque no puedes multiplicar dos matrices 1xN. Tendría que transponer cada arreglo a Nx1, y eso es bastante cojo, ya que lo haría por cada cálculo de producto de punto.
A continuación, traté de crear una matriz NxN donde la columna 1 == fila 1 (de forma que se pueden multiplicar dos matrices y simplemente tomar la esquina superior izquierda como el producto escalar), pero eso resultó ser realmente ineficiente.
Me encantaría usar el paquete escaso de scipy como un reemplazo mágico para la matriz de numpy(), pero aún no estoy seguro de qué hacer.
¿Algún consejo?
Vea los comentarios a continuación, pero acabo de rodar mi propia implementación de vector disperso, usando algo similar a una matriz "dok". – spitzanator
El enlace de la pregunta original parece haber muerto. @spitzanator. – Mark