Estoy intentando averiguar cómo usar sphinx4 o pocketsphinx con el modelo de voxforge en inglés, pero no puedo hacerlo funcionar. He intentado leer páginas de doc (como esta http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html) pero no me sirve.Cómo utilizar CMU Sphinx 4 para voz a texto con los modelos de voxforge en inglés
Lo que quiero es un ejecutable en el que pueda especificar qué modelo usar y qué archivo de audio usar como fuente y hacer que el archivo ejecutable sea mejor que adivinar lo que dice la voz en la grabación.
que hade un poco de suerte con: recording.wav -infile pocketsphinx_continuous 2>/dev/null
Pero aborta antes se transcribe el archivo de audio completo y el modelo por defecto tiene waay a unas palabras para crear una legibles texto del audio
He compilado y probado las demostraciones en el paquete fuente sphinx4 pero todos los ejemplos parecen tener pocas palabras y necesita un modelo de la voxforge para ser útil para mí.
¿Cómo puedo configurar esto?
que he sido capaz de modificar Sphinx para transcribir usando los modelos de Voxforge. La mala noticia es que incluso con Voxforge, la precisión de Sphinx es embarazosamente mala. No perdería el tiempo con Sphinx. No es usable en absoluto. – Cerin
@Cerin, ¿qué recomendarías como alternativa? –
También estoy interesado en alternativas. ¿Podrías darnos algo mejor? Preferible gratis? – Simon