2011-05-14 16 views
5

Estoy buscando una biblioteca de OCR o cualquier muestra que pueda usar para leer letras en árabe de una imagen. Busqué en Google mucho y no encontré nada ... por favor ayuda gracias en avanzar.OCR de código abierto para árabe

+0

http://stackoverflow.com/questions/4696180/open-source-ocr-library-for-arabic http://stackoverflow.com/questions/6825712/need-an-opensource-of-arabic-ocr- cualquiera-en-java-o-en-dotnet –

Respuesta

1

Puede probar el Abbyy Fine Reader, es posible que tengan el idioma que está buscando.

+0

es una biblioteca cerrada ... necesito una fuente abierta para hacer eso – Ramah

+1

Tal vez deberías mencionar eso en tu pregunta. Encontrar un buen OCR de fuente abierta será muy difícil, especialmente para árabe. –

7

TesseractOCR es probablemente el mejor motor de OCR de código abierto disponible y es muy flexible en cuanto a lo que puede reconocer. Permite la capacitación con datos personalizados, por lo que esencialmente cualquier idioma es posible siempre y cuando esté dispuesto a poner en el trabajo (es decir, crear el conjunto de entrenamiento).

Hay tools provided by tesseract (con una interfaz gui) que pueden ayudar a crear el conjunto de datos donde se especifica el cuadro delimitador de caracteres y la transcripción correspondiente.

EDIT: Notado de otra publicación (vinculada anteriormente) que ya se ha creado un conjunto de entrenamiento en árabe para la versión 3.01. Solo necesitarás conectar los datos en árabe y tu problema está resuelto :).

Cuestiones relacionadas