Estoy trabajando en el proyecto de Android sobre reconocimiento de música óptica. Tomo una foto de una partitura a través de una cámara móvil y trato de reconocer las notas y los símbolos. Estoy muy familiarizado con la metodología después del preprocesamiento, pero este tipo de trabajo generalmente se realiza con la ayuda de un escáner. (en cambio tengo que usar una cámara móvil)Detección de línea en una imagen de hoja musical en Android
Intuitivamente, usé primero la transformada de hough para detectar pentagramas (líneas del pentagrama), luego calculo el ángulo entre ellos y el eje horizontal y giro la imagen tanto como el ángulo. Esto podría funcionar teoraticamente pero encuentra segmentos de linea y el angulo de estos segmentos no son consistentes. Así que no funcionó. (Tal vez por el efecto de la perspectiva)
Después de eso, probé muchos algoritmos de detección de bordes y búsqueda de líneas, pero ninguno de ellos funcionó estable. (incluida la rotación del dominio de frecuencia y los detectores del segmento de línea)
Ahora estoy pensando en un nuevo enfoque similar al de los escáneres de documentos en Android. Intento convertir mi imagen en un formulario como documento escaneado. Quiero alinear mi imagen con el eje horizontal y deshacerme del efecto debido a la inclinación y la perspectiva.
Me pregunto si alguien tiene alguna idea sobre cómo lograr este "escaneo de documentos". O si tiene alguna idea sobre cómo alinear el documento o la detección de línea estable, sería más que útil para mi trabajo futuro. Gracias.
[este blog] (http://gaut.am/making-an-ocr-android-app-using-tesseract/) puede o no ser útil –
Si eres dispuesto a usar Java, es posible que desee consultar http://audiveris.kenai.com/, un motor de reconocimiento óptico de música de código abierto (divulgación: hace poco tiempo fui colaborador). – btown
@JasonRobinson: Sería útil para un proyecto de OCR, pero no para este creo, gracias de todos modos. –