2011-01-14 13 views
12

Estaba buscando una biblioteca de OCR, que sería de código abierto, que podría usar en algunos archivos PDF árabes. Buscar en Google no resultó en nada útil. Me preguntaba si alguien conoce una biblioteca de OCR relacionada o incluso una que funcione en idiomas relacionados (Farsi y Urdu podrían ser relevantes) a los que se podría agregar soporte en árabe.Open-source OCR library for Arabic

Cualquier sugerencia general sobre cómo abordar esto será apreciada.

+0

http://stackoverflow.com/questions/6003630/open-source-ocr-for-arabic http://stackoverflow.com/ preguntas/6825712/need-an-opensource-of-arabic-ocr-either-in-java-or-in-dotnet –

Respuesta

0

No sé nada acerca de la calidad del árabe OCR, pero algunos inteligentes Google encontraron Sakhr's Automatic Reader. Es un software comercial.

Lo siento. Es comercial y bastante caro. El árabe es probablemente uno de los idiomas más difíciles del mundo para hacer OCR, creo que se necesita mucho para motivar a alguien a hacerlo.

7

partir de la Versión 3.01 de Tessaract-ocr que ahora es compatible con el árabe

0

La lengua árabe es sofisticado cuando se trata de OCR debido a la naturaleza de la lengua y no hay software libre o comercial que puede obtener 100% de precisión.

Esto es de mi experiencia personal, pero se puede tratar IRISREadIRIS pro 14.

+0

Por favor intente y vuelva a formatear su publicación para agregar algo de gramática, es muy difícil de leer como tal. He empezado, pero se necesita algo más de trabajo. – Vality