2011-09-05 39 views
16

Tengo un archivo de audio (conversación telefónica grabada de 2 personas). Necesito separar las voces de 2 parlantes automáticamente. Soy nuevo en el reconocimiento de voz y busqué en el módulo Wave de Python, pero faild para encontrar información fructífera.Python Speaker Recognition

Por favor, ayuda para saber cómo empezar. También sugiérame bibliotecas gratuitas de Python que me ayudarán a resolver el problema.

Respuesta

13

La tarea de separación de los altavoces no es una tarea de reconocimiento de voz, es una tarea de reconocimiento de hablante. En la comunidad del habla, esta tarea también se conoce como diarización del hablante. Hay varios paquetes para diarización altavoz y el reconocimiento del hablante disponibles para Python:

SIDEKIT from LIUM

Bob toolkit from Idiap

Speaker diarization from ISCI

En caso de que no se limitan a Python, hay otros:

LIUM speaker diarization

Speaker recognition setup in Kaldi. Incluye i-vectores basados ​​en DNN de última generación.