Es10 * 10 veces la validación cruzada en scikit-learn?
class sklearn.cross_validation.ShuffleSplit(
n,
n_iterations=10,
test_fraction=0.10000000000000001,
indices=True,
random_state=None
)
el camino correcto para 10 * de 10 veces CV en scikit-learn? (Cambiando la random_state 10 números diferentes)
Debido a que no encontrar cualquier random_state
parámetro en Stratified K-Fold
o K-Fold
y la separada de K-Fold
son siempre idénticos para los mismos datos.
Si ShuffleSplit
es el derecho, una de las preocupaciones es que se menciona
Nota: al contrario de otras estrategias de validación cruzada, se divide al azar no garantía de que todos los pliegues será diferente, aunque esto sigue siendo muy probable para conjuntos de datos grandes
¿Siempre es así para 10 * 10 veces CV?
Gracias, es exactamente lo que estaba buscando. Por cierto, vi 42 muchas veces en ejemplos en la página web, ¿alguna historia para eso? – Flake
Usted está haciendo la pregunta incorrecta :) http://en.wikipedia.org/wiki/42_(Hitchhiker%27s_Guide_to_the_Galaxy)#Answer_to_the_Ultimate_Question_of_Life.2C_the_Universe.2C_and_Everything_.2842.29 – ogrisel
¡Lo sabía! Pero se olvidó de 42 es el que ... – Flake