¿Hay alguien que tenga experiencia con cualquier código abierto o API de reconocimiento de voz relativamente barata para Java? Estoy buscando algo que convierta las palabras habladas en texto.reconocimiento de voz Java
Desde la página de reconocimiento de voz de java en el sol, parece que es algo que está bastante muerto. Mis requisitos son algo que al menos se ejecuta en Linux.
¿Alguien puede recomendar algo? Java puro sería una ventaja, de lo contrario podría considerarse una solución basada en Linux. Y como este es un proyecto hogareño ... cuanto más barato, mejor.
- Editar
CMU Sphinx Como se señaló Amit CMU Sphinx http://cmusphinx.sourceforge.net/html/cmusphinx.php Mi problema es una tasa de error de palabra masiva. El entrenamiento parece un proyecto en sí mismo, espero reunir fuerzas para probarlo este fin de semana.
IBM ViaVoice
Hay anuncios de noticias flotando alrededor de 2004 sobre Via Voice being made open source. Parece que el comunicado de prensa fue prematuro y que nunca sucedió. VIA Voice fue released for linux en algún momento, pero parece que se detuvieron. Todo lo que parece quedar en el sitio web de IBM es ViaVoice embedded.
IBM Websphere Voice
Me imagino que este es el motivo por el cual ViaVoice (desktop) parece descontinuado. IBM creó esta solución comercial que costará mucho más que un brazo y una pierna. Y solo usarlo tomará los que te quedan, al menos después de mi experiencia con websphere y su IDE.
Nuance
Parece que todavía pueden crear productos para Linux. Pero creo que se perdieron y siguieron a IBM en el mercado de servidores. No estoy seguro de esto, su sitio web no es tan amigable para encontrar información útil.
Open Mind/Free Speech
Estos tipos siguen cambiando el nombre de su proyecto. Probablemente alguna compañía hambrienta de dinero los siga amenazando, pero no lo sé. El proyecto parece un poco muerto.
Podría intentar entrenar a Sphinx este fin de semana para ver si quiere ser amigos. En otro caso peor, voy a ver el uso de la solución de voz de Microsoft. Me ha funcionado bien en el pasado, pero no es una gran solución de Linux. Probablemente podría usarlo a través del vino, pero luego tendré dos servidores separados ... desordenados.
Ah, y lo que parece un buen lugar para visitar para voz/habla SpeechTechMag. Tienen una 'referencia anual' que tiene una lista de compañías que de alguna manera se relacionan con voz/habla.
Después de trabajar con él, de hecho es bastante horrible. Apenas reconoce algo, y no es como si tuviera un acento horrible o algo así. El entrenamiento parece un problema aún mayor y, a menos que esté dispuesto a embolsarse una base de datos de terceros, su sesión quedará en el fondo del montón. – guyumu
No he tenido ninguna experiencia práctica con él./ –
Esta pregunta es bastante antigua, pero me gustaría decir el rendimiento actual de Sphinx. Utilicé Sphinx 4 y adapté el modelo WSJ y me dio un 86% de precisión. – Shekhar