2009-04-03 24 views
9

Estoy buscando algoritmos, documentos o software para mejorar los faxes, imágenes de cámaras de teléfonos celulares y otras fuentes similares de legibilidad y OCR.Algoritmos de procesamiento/mejora de imagen para el documento OCR/legibilidad?

Estoy interesado principalmente en mejoras simples (por ejemplo, cosas que podría hacer con ImageMagick), pero también estoy interesado en técnicas más sofisticadas. Ya estoy hablando con proveedores, por lo que para esta pregunta estoy buscando algoritmos o software de código abierto.

Para aclarar más: No estoy buscando software o algoritmos de OCR; Estoy buscando algoritmos para limpiar la imagen para que se vea más legible para el ojo humano, y posiblemente se pueda usar para OCR.

Respuesta

5

tuve un problema similar cuando estaba escribiendo algún software para hacer el escaneo de libros; Flotando por internet hay un programa llamado pagetools que endereza las páginas escaneadas usando un truco matemático bastante inteligente llamado Transformada de Radón.

También escribí una pequeña rutina que blanqueaba el espacio en blanco en la página; Los algoritmos de OCR tienden a funcionar mucho mejor cuando no tienen que lidiar con el ruido de fondo. Lo que hice fue buscar píxeles de color claro que tenían más de un pequeño radio de los de color oscuro, y luego aumentarlos hasta ser de color blanco puro.

Han pasado algunos años, entonces, no tengo los detalles de implementación exactos a mano.

4

Un filtro de imagen simple para ver es el "Filtro de mediana", que es un filtro muy sencillo, fácil de implementar, para ayudar a limpiar el texto escaneado/fotografiado. http://en.wikipedia.org/wiki/Median_filter

Cuestiones relacionadas