Respuesta

4

Aquí está el mejor tutorial sobre el entrenamiento de Haar. ¿Has probado esto? http://note.sonots.com/SciSoftware/haartraining.html

Dice que usaron 5000 para positivo y 3000 para negativo.

Este link dice 3000 para positivo y 5000 para negativo. De todos modos, una mayor cantidad de imágenes mejora la precisión, pero también aumenta el tiempo de entrenamiento.

También verifique otros enlaces SO here.

+3

Gracias por los enlaces. El segundo que no había visto. Una cosa que desconcierta es el concepto de muestras negativas. ¿No tendría sentido que las muestras negativas contengan partes de la imagen de donde provienen las muestras positivas, pero sin las muestras positivas? La mayoría de los tutoriales mencionan el uso de muestras negativas que contienen imágenes aleatorias que no están relacionadas con las muestras positivas. Me parece que si toma muestras positivas de fruta de una foto de mercado de frutas, ¿desea que las muestras negativas sean de otras frutas que normalmente se encuentran en la misma foto de un mercado de frutas? – Rhubarb

+0

bien, la pregunta tiene sentido, pero me temo que no sé su respuesta. En general se toma como los que figuran en los enlaces en respuesta. –

+1

Tiene razón, @Rubbar. Del mismo modo que las muestras positivas deben ser lo más representativas posible de lo que intenta aprender, las muestras negativas deben ser tan representativas de lo que * no * intenta aprender como sea posible. En su ejemplo, claramente el ideal es como usted dice; sin embargo, si la discriminación del algoritmo no es muy aguda, es posible que los ejemplos negativos que son demasiado similares a los ejemplos positivos (fruta similar) en realidad no ayuden. Llevar esto más allá, en la línea del aprendizaje curricular, uno podría introducir ejemplos más difíciles de discernir a medida que avanza la capacitación. – Ninjakannon

Cuestiones relacionadas