No deseo el software de sonido a texto. Lo que necesito es la siguiente:Biblioteca/código de reconocimiento de muestras de sonido
- voy a grabar múltiples (por ejemplo 50+) flujos de audio (grabaciones de emisoras de radio)
- de que las grabaciones, voy a marcar clips de audio interesantes - su longitud oscila entre 2 a 60 segundos - habrá pocos miles de estos clips de audio
- biblioteca debe ser capaz de encontrar otros ejemplos de mismos clips de audio de sonido grabado arroyos
- factor de confianza debe ser reportado al utilizado y la potencia adicional proporciona para el reconocimiento podría funcionar mejor la próxima vez
¿Conoces dicha biblioteca de software? LGPL sería muy valioso para mí, pero también puedo obtener una licencia comercial.
Los clips de audio contendrán música, texto, efectos o cualquier combinación de los mismos. Por lo tanto, el reconocimiento de texto está fuera de cuestión.
Arquitectura: C++, C# para pegamento, CUDA si es posible.
¿Los clips de audio contienen voz, sonidos, música, todo esto? – mdma
¿Tiene una arquitectura de lenguaje o procesador específica en mente? –
Por cierto, creé mi propia implementación, después de 2 años de desarrollo, y está disponible para la explotación comercial :) http://www.videophill.com/index.php?page=playkontrol –