En la mayoría de las clasificaciones (por ejemplo, regresión logística/lineal) el término de sesgo se ignora durante la regularización. ¿Obtendremos una mejor clasificación si no regularizamos el término de sesgo?¿Por qué el término de sesgo no se regulariza en la regresión de cresta?
5
A
Respuesta
7
Ejemplo:
Y = aX + b
Regularización se basa en la idea de que overfitting en Y
es causada por a
ser "excesivamente específica", por así decirlo, que se manifiesta generalmente por grandes valores de los elementos a
's.
b
simplemente compensa la relación y su escala por lo tanto es mucho menos importante para este problema. Además, en caso de que se necesite una compensación grande por cualquier razón, regularizarla evitará encontrar la relación correcta.
Así que la respuesta está en esto: en Y = aX + b
, a
se multiplica con la variable explicativa, se le agrega b
.
Cuestiones relacionadas
- 1. ¿Qué se entiende por el término "Instrumentación"?
- 2. ¿Qué se entiende por el término "pila web"?
- 3. ¿Por qué el estándar IEEE 754 usa un sesgo 127?
- 4. ¿Qué se entiende por el término "objeto sucio"?
- 5. Implementación de detección de cresta
- 6. ¿Cómo actualizar el sesgo en la propagación de redes neuronales?
- 7. ¿Qué significa el término "BODMAS"?
- 8. ¿Qué significa el término "restringido" en java?
- 9. ¿Por qué a veces escucho el término "variable léxica"?
- 10. ¿Qué significa el término "léxico" en C++?
- 11. Error estándar en la regresión no lineal
- 12. ¿A qué se refiere el término Clang TOT?
- 13. ¿Por qué Scikit GradientBoostingClassifier no me deja usar la regresión de mínimos cuadrados?
- 14. ¿Qué significa el término "bloqueo" en la programación?
- 15. Agregar un término afín a función de objetivo de regresión logística/SVM lineal
- 16. ¿Qué es un "valor de sesgo" de números de coma flotante?
- 17. RandomForest en R colas de regresión lineal mtry
- 18. ¿Por qué no se solicita el destructor en la excepción?
- 19. C Objetivo: Modulo sesgo
- 20. ¿Qué significa el término "Verilog Synthesis"?
- 21. ¿Qué idioma acuñó el término lvalue?
- 22. Heredoc: ¿qué significa realmente el término 'EOT'?
- 23. ¿Por qué no se estandariza el nombre
- 24. Dónde y cómo se usa el término WRAPPER en la programación, ¿qué ayuda hacer?
- 25. Powershell error "El término 'Get-SPWeb' no se reconoce como el nombre de un cmdlet, función ..."
- 26. Efectos de Stemming en el término frecuencia?
- 27. Regresión lineal y agrupar por en R
- 28. Pruebas de regresión en C++
- 29. El término "cláusula" en el contexto de la programación
- 30. ¿Por qué no se cuelga?
gracias por su respuesta. Lo entiendo ahora. –