Me gustaría detectar los números básicos de inglés de 0 a 9 usando OCR simple en Android. He buscado OCR para Android, pero es demasiado complejo para mi propósito principal, ¿hay alguna manera más simple de detectar números en Android?¿Cuál es la mejor manera de hacer el reconocimiento de números básicos?
Respuesta
Una alternativa simple es predefinir los dígitos como mapas de bits, y encontrarlos usando la correlación cruzada normalizada.
Hay muchas desventajas en este método:
- Sin robustez a diferentes fuentes
- Sin robustez a escala de los números
- ...
Pero tal vez eso es lo que solo es necesario para empezar.
Si desea realizar OCR desde la cámara del teléfono, será difícil usar mapas de bits predefinidos: las fotos se tomarán con diferentes escalas, contendrán ruido, se mostrarán, etc. difícilmente ser lo suficientemente preciso
Si está desarrollando una aplicación de Android, lo más probable es que utilice Java. La mala noticia es que no hay SDK Java OCR nativos de código abierto. Hay API Java que envuelven llamadas para interfaces nativas, por ejemplo, para uno de los motores de OCR de código abierto más populares: Tesseract (http://groups.google.com/group/tesseract-ocr/) - hay algunos envoltorios de Java como tesjeract (http://code.google.com/p/tesjeract/) o Tess4J (http://tess4j.sf.net/). Eso podría funcionar para usted, pero es bastante difícil de configurar y requerirá el desarrollo de preprocesamiento de imágenes y el entrenamiento de fuentes de su lado.
Una solución más podría ser un servicio en la nube. Requiere que la aplicación del usuario final tenga conexión a Internet, pero es independiente de la elección del idioma de programación y las limitaciones de recursos. Eche un vistazo al ABBYY Cloud OCR SDK, es un OCR SDK basado en la nube lanzado recientemente por ABBYY. Está en versión beta, por lo que ahora es totalmente gratuito y tiene un archivo listo para usar Android code samples. Tiene preprocesamiento de imágenes incorporado, no requiere capacitación y simplemente funciona de inmediato: solo envía e imprime y recibe datos ocr-ed. Además, tiene una funcionalidad de reconocimiento a nivel de campo que podría ahorrarle una pieza valiosa de recursos de procesamiento de dispositivos pequeños. Trabajo @ ABBYY y puedo proporcionarle información adicional sobre nuestros productos si es necesario.
- 1. ¿Cuál es el mejor lenguaje para el reconocimiento de huella?
- 2. ¿Cuál es la mejor manera de hacer respaldos automáticos?
- 3. ¿Cuál es la mejor manera de hacer bucles en JavaScript
- 4. ¿Cuál es la mejor manera de hacer GUI en Clojure?
- 5. ¿Cuál es la mejor manera de determinar números duplicados de tarjetas de crédito sin almacenarlos?
- 6. La mejor manera de almacenar fecha/hora en datos básicos
- 7. ¿cuál es la mejor manera de editar el archivo csv
- 8. ¿Cuál es el método más moderno para hacer reconocimiento facial?
- 9. ¿Cuál es la mejor manera de deducir una mesa?
- 10. ¿Cuál es la mejor manera de obtener números aleatorios en NumPy?
- 11. ¿Cuál es la mejor manera de representar arbitrariamente números grandes en c?
- 12. ¿Cuál es la mejor manera de documentar el código f #?
- 13. ¿Cuál es la mejor manera de probar el código GWT
- 14. ¿Cuál es la mejor manera de gestionar el cambio?
- 15. ¿Cuál es la mejor manera de reutilizar el analizador Lua?
- 16. ¿Cuál es la mejor manera de analizar los números localizados de .NET/Razor en javascript?
- 17. ¿Cuál es la mejor manera de hacer el desarrollo de Java en Emacs?
- 18. ¿Cuál es la mejor manera de hacer una aplicación de mapas para el iPhone
- 19. ¿Cuál es la mejor manera de crear y completar una tabla de números?
- 20. ¿Cuál es la mejor manera de afirmar la igualdad numpy.array?
- 21. ¿Cuál es la mejor manera de hacer aritmética base36 en Perl?
- 22. ¿Cuál es la mejor manera de ampliar la funcionalidad?
- 23. La mejor manera de hacer hooks PHP
- 24. ¿Cuál es la mejor manera de alternar impresiones de pitón?
- 25. ¿Cuál es la mejor manera de hacer la validación de entrada en C++ con cin?
- 26. ¿Cuál es la mejor manera de hacer que la salida de una secuencia entre
- 27. ¿Cuál es la mejor manera de solucionar problemas de rendimiento?
- 28. ¿Cuál es la mejor manera de escribir comentarios en C?
- 29. Cuál es la mejor manera de paginar resultados en php
- 30. ¿Cuál es la mejor manera de dibujar en la consola?
¿Necesita OCR de ellos desde la cámara del teléfono? – Nikolay
@Nikolay Sí, lo necesito. –