feedforward red neuronal para OCR

Actualmente estoy aprendiendo sobre redes neuronales y estoy tratando de crear una aplicación que pueda ser entrenada para reconocer caracteres escritos a mano. para este problema uso una red neuronal feedforward y parece funcionar cuando lo entreno para reconocer 1, 2 o 3 caracteres diferentes. pero cuando trato de hacer que la red aprenda más de 3 caracteres se estancará con un porcentaje de error alrededor del 40 - 60%.feedforward red neuronal para OCR

intenté capas múltiples, menos/más cantidad de neuronas pero parece que no puedo hacerlo bien, ahora me pregunto si una red neuronal feedforward es capaz de reconocer tanta información.

algunas estadísticas:

tipo de red: red neuronal feedforward.

neuronas de entrada: 100 (10 * 10) de rejilla se utiliza para dibujar los caracteres

neuronas de salida: la cantidad de caracteres a regocnize

¿alguien sabe cuál es el posible defecto en mi arquitectura es? ¿hay demasiadas neuronas de entrada? ¿La red neuronal feedforward no es capaz de retener el carácter?

gracias de antemano.

Fuente

2012-03-13 Marnix v. R.

¿Cuántas neuronas ocultas está usando? – mbatchkarov

Las neuronas de entrada y salida parecen estar bien para su tarea, pero ¿cómo entrena su red? ¿Qué algoritmo usa? ¿Cómo inicializas pesas? – maximdim

intenté usar backpopagation y un algoritmo genético. también lo probé con una capa oculta de 70 neuronas y una con 2 capas ocultas (70 y 40) de neuronas. –

Para el reconocimiento de caracteres manuscritos que necesita

muchos ejemplos de entrenamiento (tal vez debería provocar distorsiones de su conjunto de entrenamiento)
función de activación softmax en la capa de salida
función de error entropía cruzada
entrenamiento con estocástico pendiente de gradiente
un sesgo en cada capa

Un buen problema de prueba es el conjunto de datos de dígitos escritos a mano MNIST. Éstos son los papeles que se aplicaron con éxito las redes neuronales en este conjunto de datos:

Y. LeCun, L. Bottou, Y. Bengio y P. Haffner: Gradiente del aprendizaje basado en Aplicada al reconocimiento de documentos, http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf

Dan Claudiu Ciresan , Ueli Meier, Luca Maria Gambardella, Juergen Schmidhuber: redes neuronales profundas grandes y grandes Excel en reconocimiento de dígitos manuscritos, http://arxiv.org/abs/1003.0358

Entrené un MLP con arquitectura 784-200-50-10 y obtuve> 96% de precisión en el conjunto de prueba .

Fuente

2012-03-13 21:04:29 alfa

Probablemente quiera seguir las Lecturas 3 y 4 al http://www.ml-class.org. El profesor Ng ha resuelto este problema exacto. Él está clasificando 10 dígitos (0 ... 9).Algunas de las cosas que había hecho en la clase que lo hace con una precisión de entrenamiento 95% son:

entrada Nueron: 400 (20x20)
- capas ocultas: 2
- Tamaño de capas ocultas: 25
- activación: sigmoide método
- Formación: descenso de gradiente
- tamaño de datos: 5000

Fuente

2012-03-14 21:12:20 nitin

-1 para un enlace muerto. – jpjacobs

Perdón por el enlace muerto ... el enlace correcto es http://www.ml-class.org. La clase fue ofrecida por Stanford. – nitin

upvoted en consecuencia;) – jpjacobs

Examine este programa ejemplo Handwritten Digit Recognation

programa utiliza un Semeion Handwritten Digit Data Set con FANN library

Fuente

2012-03-14 22:06:25

que tenía un problema similar hace algún tiempo tratando de identificar los dígitos escritos a mano utilizando el conjunto de datos MNIST. Mi red neural feedforward estaba dando una precisión de aproximadamente el 92% en el conjunto de validación, pero con frecuencia estaba clasificando erróneamente las imágenes que le di.

Resolví este problema agregando una capa oculta en mi red y usando RMSProp. La red ahora ofrece una precisión de alrededor del 97% y clasifica correctamente las imágenes que le doy.

Además, si su costo no está disminuyendo, probablemente signifique que su tasa de ng es demasiado alta o que su red probablemente se encuentre estancada en un mínimo local. En tal situación, podría intentar disminuir su índice de aprendizaje y los pesos iniciales.

Fuente

2017-04-05 09:49:34

Respuesta

Cuestiones relacionadas