2012-02-28 17 views
7

No entiendo nada de OCR. Solo necesito (si es que es posible) obtener un .jar para importar a Eclipse, que puedo dar una imagen (.bmp, .tiff, .jpeg) para la entrada y me da una cadena con el contenido de texto de la imagen. No es captchas o escritura a mano, solo una "foto" simple de algunas letras.JAVA OCR API de código abierto en eclipse

Se agradecen las soluciones de código abierto. Vi proyectos como Tess4j o JavaOCR pero son un poco complicado de manejar :(

Cualquier persona tiene una sugerencia

Actualización:?. He encontrado que AspriseOCR es muy fácil de usar Sólo tiene que importar el .jar a la ruta de compilación y llamar a un método. ¡Muy bien! Pero ... ¡No puedo usarlo en mis propios proyectos! ¿Conoces una biblioteca tan simple como Asprise? (No necesito compilar nada, ni tengo ningún tipo de formación:. Sólo tiene que importar y eso es todo !!)

+0

revise esto: http://stackoverflow.com/questions/1813881/java-ocr-implementation y este http://asprise.com/product/ocr/index.php?lang=java – Favonius

+0

1) ¿Por qué? -¿fuente? ¿Está sugiriendo que alguien que no * "entiende nada de OCR" * podría realizar cambios o extensiones de forma rentable en el código? ¿O realmente quieres decir "libre"? 2) 'Java' solo tiene una letra mayúscula, es un nombre propio, en lugar de un acrónimo que se deletrea 'JAVA' 3) Por favor, deje el ruido como 'Saludos N.' –

+2

Gracias por su respuesta. 1) ¡El código abierto es solo porque no tengo dinero para comprar la biblioteca! No quiero hacer ninguna extensión del código, pero podría usarlo en una de mis aplicaciones móviles, más o menos. 2) No tengo el inglés como mi "idioma materno", así que puedo cometer algunos errores, lo siento. 3) Siempre trato de ser cortés :) – nunoaac

Respuesta

9

por lo que yo saber que no hay SDK Java OCR nativos de código abierto. Hay API Java que envuelven llamadas para interfaces nativas, por ejemplo, para uno de los motores de OCR de código abierto más populares: Tesseract (http://groups.google.com/group/tesseract-ocr/). Hay algunos envoltorios de Java como tesjeract (http://code.google.com/p/tesjeract/) o Tess4J (http://tess4j.sf.net/). Eso podría funcionar para usted, pero es bastante difícil de configurar y requerirá el desarrollo de preprocesamiento de imágenes y el entrenamiento de fuentes de su lado.

Una solución más podría ser un servicio en la nube. Requiere que la aplicación del usuario final tenga conexión a Internet, pero es independiente de la elección del idioma de programación y las limitaciones de recursos. Eche un vistazo a http://ocrsdk.com, es un SDK de OCR basado en la nube que le permite cargar una imagen a través de API web y le devuelve los datos OCRed. Este OCR SDK basado en API web no es gratuito, lo que puede no ser adecuado para usted, pero aún así recomiendo que lo pruebe (tiene una versión de prueba gratuita) ya que su precio es realmente asequible en comparación con las soluciones empresariales mientras proporciona nivel empresarial Exactitud de OCR que es mucho mejor que la fuente abierta. También puede encontrar útil este Java codesample en github. Descargo de responsabilidad: yo trabajo @ ABBYY.

+0

¿ABBYY también nos permite cargar un archivo PDF (que puede ser un documento escaneado) para obtener los datos OCRed? – Dax

Cuestiones relacionadas