2008-08-05 10 views
25

Actualmente estoy trabajando en un proyecto y mi objetivo es ubicar texto en una imagen. OCR'ing el texto no es mi intención hasta el momento. Quiero básicamente obtener los límites del texto dentro de una imagen. Estoy usando el componente de imágenes AForge.Net para la manipulación. ¿Alguna ayuda en algún sentido u otro?Localización de texto dentro de la imagen

Actualización 2/05/09: Desde entonces he seguido otra ruta en mi proyecto. Sin embargo, intenté obtener texto usando MODI (Microsoft Office Document Imaging). Le permite OCR una imagen y extraer texto de ella con cierta facilidad.

Respuesta

12

Este es un área activa de investigación. Hay literalmente montones de trabajos académicos sobre el tema. Va a ser difícil brindarle asistencia, especialmente sin más diálogos. ¿Estás buscando tipos específicos de texto? ¿Fuentes? ¿Solo inglés? ¿Estás familiarizado con la literatura académica?

La "detección de texto" es un problema estándar en cualquier sistema OCR (reconocimiento óptico de caracteres) y, en consecuencia, hay muchos bits de código en las interwebs que se ocupan de él.

Podría comenzar a listar montones de enlaces de Google, pero sugiero que haga una búsqueda de "detección de texto" y comience a leer :). Hay un amplio código de ejemplo disponible también.

3

reconocer texto dentro de una imagen es de hecho un tema candente para los investigadores en ese campo, pero solo comenzó a crecer fuera de control cuando captcha's se convirtió en la "norma" en términos de defensa contra robots de spam. ¿Por qué usar captcha como protección? ¡bien porque es/fue muy difícil localizar (y leer) texto dentro de una imagen!

La razón por la que menciono el captcha es porque la mayor parte del avance * se realiza dentro de esa pequeña área, y creo que su solución podría encontrarse mejor allí. especialmente porque los captchas se refieren a la localización de texto (o algo parecido al texto) dentro de una imagen desordenada y luego a leer las letras correctamente.

lo que si puede encontrarse a good open source captcha breaking tool es probable que tenga todo lo que necesita para continuar su búsqueda ...
Probablemente se podría incluso tirar el código más dificil que se encarga del reconocimiento de caracteres en sí, porque esos de la OCR se utilizan para leer texto distorsionado, algo que no tiene que hacer.

*: avance en términos de visible, útil y práctico información para un "no-investigador"

+0

La otra razón para mencionar el captcha es que probablemente sea su "proyecto". :-) –

Cuestiones relacionadas