2012-03-05 13 views
5

estoy desarrollando una aplicación de escritorio usando java. esta aplicación es para niños en edad escolar para enseñar inglés, donde el usuario puede subir un poco de audio en inglés que puede estar en cualquier formato que deba convertirse en archivo de texto. donde pueden leer el texto.conversión de archivos de audio a archivos de texto usando java

He encontrado algunas API, pero no estoy seguro de ellas.

http://cmusphinx.sourceforge.net/wiki/

que he visto muchas preguntas sobre stackoverflow con respecto a este pero ninguno era útil. si alguien puede ayudar en esto será muy agradecidos

gracias

+4

Solo para decirte, lo que estás tratando de lograr no es trivial, y probablemente no haya una solución que te otorgue una conversión del 100% ... al revés (text2speech) es mucho más fácil. Es posible que desee buscar en las aplicaciones/libs de terceros que lo hacen, no necesariamente en Java, y luego simplemente integrarse con ellas. – Marcelo

Respuesta

3

Existen muchas tecnologías y servicios disponibles para realizar reconocimiento de voz. Para una introducción a algunas de las opciones, vea https://stackoverflow.com/a/6351055/90236.

No estoy seguro de que los resultados sean aceptables para enseñar a los niños el inglés como segundo idioma, pero vale la pena intentarlo.

3

Lo que buscas está rompiendo tecnología de punta. Las herramientas como cmusphinx pueden detectar palabras de un diccionario dedicado y limitado (para que pueda enseñarle a comprender, digamos, 15 palabras y eso es todo; no puede enseñarle a comprender el inglés).

Básicamente, esas herramientas intentan encontrar patrones en las ondas de sonido que usted les da de comer. No entienden nada, solo usan el mismo algoritmo en cualquier cosa y luego tratan de encontrar la coincidencia más cercana. Esto funciona bien para juegos pequeños de palabras, pero a medida que aumenta el número de palabras, la diferencia entre ellos se reduce y los trabajos se vuelven cada vez más difíciles (sin siquiera comenzar con palabras como "clima" o "C" y ver).

Lo que podría considerar es el software "repetir después de mí". Aquí, debe registrar todas las palabras para la prueba como plantillas. Luego puede registrar las palabras de los alumnos y luego calcular la diferencia. Si la diferencia no es demasiado grande, la palabra es correcta. Pero de nuevo: esta es una repetición simple para mejorar la pronunciación, no en inglés.

Hay software de escritorio que puede comprender mucho inglés (por ejemplo, los productos de Nuance, siendo Dragon Naturally Speaking uno de los más destacados). Ofrecen soluciones de servidor, pero ese software no es gratuito o barato si tiene un presupuesto ajustado.

Cuestiones relacionadas