2011-12-31 55 views
10

Estoy intentando averiguar cómo usar sphinx4 o pocketsphinx con el modelo de voxforge en inglés, pero no puedo hacerlo funcionar. He intentado leer páginas de doc (como esta http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html) pero no me sirve.Cómo utilizar CMU Sphinx 4 para voz a texto con los modelos de voxforge en inglés

Lo que quiero es un ejecutable en el que pueda especificar qué modelo usar y qué archivo de audio usar como fuente y hacer que el archivo ejecutable sea mejor que adivinar lo que dice la voz en la grabación.

que hade un poco de suerte con: recording.wav -infile pocketsphinx_continuous 2>/dev/null

Pero aborta antes se transcribe el archivo de audio completo y el modelo por defecto tiene waay a unas palabras para crear una legibles texto del audio

He compilado y probado las demostraciones en el paquete fuente sphinx4 pero todos los ejemplos parecen tener pocas palabras y necesita un modelo de la voxforge para ser útil para mí.

¿Cómo puedo configurar esto?

+1

que he sido capaz de modificar Sphinx para transcribir usando los modelos de Voxforge. La mala noticia es que incluso con Voxforge, la precisión de Sphinx es embarazosamente mala. No perdería el tiempo con Sphinx. No es usable en absoluto. – Cerin

+0

@Cerin, ¿qué recomendarías como alternativa? –

+0

También estoy interesado en alternativas. ¿Podrías darnos algo mejor? Preferible gratis? – Simon

Respuesta

10

Es muy simple conectar el modelo acústico Voxforge. El documento principal que cubre la API es tutorial CMU Sphinx:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

Se recomienda leerlo antes de empezar. Tenga en cuenta también que se recomienda utilizar En_US English Modelo acústico genérico, es más preciso que Voxforge.

paso a paso que tiene que hacer lo siguiente:

  • Descargar voxforge model de SourceForge y descomprimirlo en una carpeta
  • Pedido sphinx4 de github y construirlo con Gradle
  • Run TranscriberDemo
  • Vaya a la carpeta sphinx4-samples/src/main/java/edu/cmu/sphinx/demo/transcriber, abra la demostración Transcriber y edite la ruta del modelo acústico como se muestra a continuación.
  • Editar la ubicación del archivo de audio en las fuentes si necesita otro archivo de audio
  • Run Demo de nuevo y disfrutar de

eso sería todo

// Load model from the folder in your project 
    configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000"); 
+1

muy buena respuesta ... también tengo un problema similar He descargado voxforge-en-0.3 de SourceForge, la carpeta etc tiene tantos frascos, que simplemente no puedo entender qué camino se debe dar ... por favor ayuda y visita http: // stackoverflow.com/questions/8727389/dictation-application-using-sphinx4 – aProgrammer

+0

No estoy seguro de qué estás hablando. ¿Qué jarras en etc.? No hay frascos en absoluto. En cuanto a esa pregunta, no ha indicado claramente el problema a resolver, ni idea de qué problema tiene allí. –

+0

Seguí tu respuesta y descargué VoxForge de sourceforge. Sin embargo, no pude configurarlo para usarlo con Sphinx4. Dijiste '', sin embargo eso no funcionó para mí. Así que busqué la Carpeta VoxForge, pero probé varias combinaciones ... pero nada está funcionando hasta el momento ... por favor ¡Ayuda! Consulte la respuesta editada .... – aProgrammer

Cuestiones relacionadas