2010-09-02 8 views
8

Estoy buscando una lib de OCR, que se puede parametrizar con una fuente, porque siempre lo sé y creo que los resultados de reconocimiento serán mucho mejores de esta manera.OCR para la fuente conocida

¿Alguien sabe?

+0

¿Estás preguntando qué fuente a utilizar para OCR o una biblioteca de OCR para reconocer una fuente conocida? – t0mm13b

+4

@ tommieb75: Creo que dice claramente que está buscando una biblioteca ... –

+0

@Matti: bien ... es la redacción de la pregunta wrt "paramterizado con una fuente" que no entendí ... – t0mm13b

Respuesta

2

Echa un vistazo OCRopus. Es de código abierto y patrocinado por Google :) No estoy seguro de si permitirá elegir una fuente en particular, pero parece producir buenos resultados independientemente.

2

La mayoría de los motores de OCR manejarán esta situación bastante bien. De hecho, los motores de OCR no se confunden si solo hay una fuente para reconocer en una página. Extraño pero cierto en mi experiencia.

Si un motor de OCR puede leer su fuente en primer lugar, entonces simplemente lo usaría y no me preocuparía. Hay mejores opciones para elegir para mejorar el reconocimiento.

Muchos motores de OCR le permiten establecer algunos parámetros de reconocimiento para ayudar a mejorar el reconocimiento, como el ancho fijo o proporcional, serif o no serif, máquina o impresión manual. También puede seleccionar un subconjunto de caracteres, como mayúsculas o numéricos, para mejorar los resultados considerablemente. Es decir. si solo tiene caracteres numéricos, entonces el carácter 0 (cero) nunca se puede confundir con una 'O' o 'o' o 'Ø'. Encontrarás que estas sugerencias serán más efectivas que la opción de poder elegir el tipo de letra exacto para OCR.

Otros motores le permitirán entrenar su motor de OCR para tratar con las nuevas fuentes y esto ayudará considerablemente si tiene una fuente extraña.

Si la calidad de su imagen es buena y sus fuentes son limpias y de un tamaño decente entonces recomendaría usar Tesseract OCR de Google y OCROpus como suggested by Michael Mior. Es gratis y funciona bien en un texto limpio y claro. Si el texto es un poco difícil, definitivamente hay mejores motores de OCR como ABBYY, Prime Recognition, Omnipage y muchos otros, aunque costarán dinero.