Estoy buscando una buena implementación para la regresión logística (no regularizada) en Python. Estoy buscando un paquete que también pueda obtener pesos para cada vector. ¿Alguien puede sugerir una buena implementación/paquete? Gracias!Regresión logística ponderada en Python
Respuesta
¿Conoces Numpy? Si no, echa un vistazo también a Scipy y matplotlib.
Scipy ni Numpy dot tienen implementación de regresión logística (o no pude encontrar ninguna ...). matplotlib se usa principalmente para gráficos, dibujos, etc. ... – user5497
Encontré este [blog] (http://blog.smellthedata.com/2009/06/python-logistic-regression-with-l2.html) – gunzapper
¡Gracias! Lo vi, sin embargo, implementa L2 regresión logística regularizada (y no regresión logística regular), y además no implementó pesos ... – user5497
Tenga una mirada en scikits.learn logistic regression implementation
Gracias, sin embargo, no pude encontrar cómo dar diferentes pesos a cada vector ... – user5497
'sklearn.linear_model.LogisticRegression' es una clase, su método' fit' le permite un peso definido. – ohe
@ohe ¿cómo? Encontré el método 'fit', pero solo acepta parámetros para etiquetas y características. No pesas –
Me he dado cuenta de que esta pregunta es bastante viejo ahora, pero espero que esto puede ayudar a alguien. Con sklearn, puede utilizar la clase SGDClassifier para crear un modelo de regresión logística simplemente pasando en 'log' como la pérdida:
sklearn.linear_model.SGDClassifier(loss='log', ...).
Esta clase implementa muestras ponderadas en la función fit()
:
classifier.fit(X, Y, sample_weight=weights)
donde pesos es una matriz que contiene los pesos de muestra que debe ser (obviamente) la misma longitud que la cantidad de puntos de datos en X.
Consulte http://scikit-learn.org/dev/modules/generated/sklearn.linear_model.SGDClassifier.html para obtener la documentación completa.
Creo que lo que quiere es statsmodels
. Tiene un gran soporte para GLM y otros métodos lineales. Si vienes de R, encontrarás la sintaxis muy familiar.
El modo “equilibrado” utiliza los valores de y para ajustar automáticamente los pesos inversamente proporcional a frecuencias de clase en los datos de entrada como N_SAMPLES/(n_classes * np.bincount (y))
from sklearn.linear_model import LogisticRegression
model = LogisticRegression(class_weight='balanced')
model = model.fit(X, y)
EDITAR
Los pesos de muestra se pueden agregar en el método de ajuste. Solo tienes que pasar una matriz de n_samples. Echa un vistazo a la documentación -
la esperanza que esto hace que ...
Esto se refiere al desequilibrio de clase, pero ¿qué ocurre si queremos usar un peso separado para cada muestra? – mrgloom
Buena pregunta @mrgloom! Puede especificar los pesos suministrando un dict de pesos en lugar de "equilibrado". Pesos asociados con las clases en la forma {class_label: weight}. Si no se da, se supone que todas las clases tienen peso uno. –
Necesito un peso separado para cada muestra, no para cada clase. – mrgloom
- 1. Regresión logística en Java
- 2. regresión "ponderada" en I
- 3. R gbm regresión logística
- 4. Regresión lineal ponderada en Java
- 5. scikit-learn Regresión logística de memoria Error
- 6. R2WinBUGS - regresión logística con datos simulados
- 7. Estadísticas de ajuste del modelo para una Regresión logística
- 8. regresión lineal segmentada en python
- 9. Trazar los resultados de un modelo de regresión logística multivariante en R
- 10. Diagnósticos para un modelo de regresión logística de efectos mixtos utilizando lmer() en el proyecto r
- 11. Cambio del grupo de referencia para la variable predictora categórica en la regresión logística
- 12. Agregar un término afín a función de objetivo de regresión logística/SVM lineal
- 13. Regresión Lineal con Python numpy
- 14. constreñido de regresión lineal en Python
- 15. términos de polinomios en logística proc y otras regresiones
- 16. Desviación estándar ponderada en NumPy?
- 17. Interpolación de distancia inversa ponderada (IDW) con Python
- 18. Distribución ponderada no aleatoria
- 19. OCR: distancia Levenshtein ponderada
- 20. aleatoria elección ponderada
- 21. elección aleatoria ponderada
- 22. ¿Correlación ponderada de Pearson?
- 23. Media ponderada por fila
- 24. Elección ponderada corta y simple
- 25. media móvil ponderada con numpy.convolve
- 26. parcela matriz de frecuencia ponderada
- 27. Elección aleatoria ponderada en T-SQL
- 28. ¿Cómo calcular la media ponderada en R?
- 29. Gráfico de densidad escalada/ponderada en R
- 30. Media agregada y ponderada en R
duplicado pssible de http://stackoverflow.com/questions/3754051/python-or-sql-logistic-regression – Mansuro
Nada relevante en esta publicación, también intenté usar scipy, pero no pude encontrar ningún uso de pesas ... – user5497