2010-04-08 5 views
7

Esperemos que la última pregunta NN que obtendrá de mí este fin de semana, pero aquí va :)red neuronal: Manejo de entradas no disponibles (datos faltantes o incompletos)

¿Hay una manera de manejar una entrada que "Don 't always know "... ¿así que no afecta las ponderaciones de alguna manera?

Soo ... si le pregunto a alguien si es hombre o mujer y no le gustaría responder, ¿hay alguna forma de ignorar esta información? ¿Tal vez colocándolo directamente en el centro? (? 1,0 asumiendo entradas a 0,5)

Gracias

Respuesta

4

Usted probablemente sabe esto o lo sospecha, pero no hay base estadística para adivinar o suministrar los valores perdidos por el promedio en el rango de posibles valores, etc.

Para NN, en particular, hay un buen número de técnicas avaialble La técnica que uso, que he codificado, es una de las técnicas más simples, pero tiene una base estadística sólida y todavía se usa en la actualidad. El documento académico que lo describe here.

La teoría que subyace a esta técnica es la integración ponderada sobre los datos incomlete. En la práctica, no se evalúan integrales, sino que se aproximan mediante soluciones de forma cerrada de redes de funciones de base Gaussianas. Como verá en el documento (que es una explicación paso a paso, es simple de implementar en su algoritmo backprop.

+0

Y ese documento, del título suena exactamente lo que estoy buscando. Voy a echar un vistazo mañana por la mañana. Gracias a ti también :) – Micheal

+0

no hay problema - si tienes un lenguaje particular en mente, probablemente pueda sugerir algunos recursos más. (Además, voy a editar tu publicación solo para agregar la etiqueta "Aprendizaje automático", si no te importa). – doug

+0

Adelante :) Estoy usando C++ para mi motor ANN. Gracias por la copiosa ayuda :) – Micheal

2

Las redes neuronales son bastante resistentes al ruido - esa es una de sus grandes ventajas. Puede intentar poner entradas en (-1.0, 1) en su lugar, con 0 como la entrada sin entrada, sin embargo. De esa forma, la entrada a los pesos de esa neurona es 0.0, lo que significa que no habrá aprendizaje allí.

Probablemente el mejor libro que he tenido la desgracia de no terminar (¡todavía!) Es Redes neuronales y máquinas de aprendizaje por Simon S. Haykin. En él, habla de todo tipo de cuestiones, incluida la forma en que debe distribuir sus entradas/conjunto de capacitación para la mejor capacitación, etc. ¡Es un libro realmente genial!

+1

Suena como una buena idea :) He estado buscando buenos libros sobre ANN's desde que me interesé por primera vez en ellos ... ahora estoy acumulando una pequeña estantería :) Tendré que buscar esta. Gracias! – Micheal

Cuestiones relacionadas