Tengo un gran scipy.sparse.csc_matrix
y me gustaría normalizarlo. Eso es restar la media de la columna de cada elemento y dividir por la desviación estándar de la columna (std) i.¿Cómo calculo la varianza de una columna de una matriz dispersa en Scipy?
scipy.sparse.csc_matrix
tiene .mean()
, pero ¿hay una manera eficiente de calcular la varianza o std?
Iba a publicar un código python para calcular la varianza de forma vectorizada, pero si lo "normaliza" no tendrá ningún elemento cero, así que antes de hacerlo, por favor díganos que no está estropeando su estructura de dispersión de todos modos. – seberg
Ese es un muy buen punto Sebastian, gracias. No pensé en eso. – nickponline