Tengo un flujo de audio y extraería palabras (habla) de él. Entonces, por ejemplo, con audio.wav obtendría 001.wav, 002.wav, 003.wav, etc. donde cada XXX.wav es una palabra.Biblioteca para extraer palabras (voz) del flujo de audio?
Estoy buscando una biblioteca o programa para hacerlo - la plataforma no importa, pero prefiero la solución de código abierto.
Gracias de antemano por su ayuda.
NB El kit Audio Mining mencionado viene con la siguiente advertencia: "** La tecnología Dragon AudioMining está diseñada específicamente para el inglés estadounidense y no está destinada a la transcripción de reuniones o entrevistas. **" – LeeGee
@greenoldman prefirió una fuente abierta solución –
Es muy difícil encontrar información sobre Nuance AudioMining en línea. Y parece ser contradictorio, ya que la transcripción de reuniones y entrevistas se mencionó explícitamente en el lanzamiento del producto en 1999: https://www.youtube.com/watch?v=yagvFY_rUwM – Christoph