¿Por qué el reconocimiento de voz es tan difícil? ¿Cuáles son los desafíos específicos implicados? Leí un question on speech recognition, que respondió parcialmente algunas de mis preguntas, pero las respuestas fueron en gran parte anecdóticas en lugar de técnicas. Además, todavía no respondía por qué todavía no podemos lanzar más hardware al problema.¿Por qué es difícil el reconocimiento de voz?
He visto herramientas que reducen el ruido automatizadas utilizando redes neuronales y análisis FFT ambiental con excelentes resultados, así que no veo razón por la que todavía estamos luchando contra el ruido excepto en escenarios difíciles como ruido de fondo ridículamente ruidoso o múltiples fuentes de habla
Más allá de esto, ¿no se trata simplemente de usar redes neuronales muy grandes, complejas y bien entrenadas para hacer el procesamiento y luego tirar hardware para que funcione lo suficientemente rápido?
Entiendo que los acentos fuertes son un problema y que todos tenemos nuestros coloquialismos, pero estos motores de reconocimiento aún se equivocan cuando la persona habla con un acento estadounidense o británico lento y claro.
Entonces, ¿cuál es el problema? ¿Qué problemas técnicos de existen que hacen que sea tan difícil que una computadora me entienda?
Para la persona que marca cerrar esto como fuera de tema/no constructivo: no veo su razonamiento. Estoy pidiendo una respuesta específica, no una lista o respuesta subjetiva. También es un desafío altamente integrado en el campo de la programación, ya que es un desafío de programación específico que existe desde hace mucho tiempo, es decir, "crear un código que escuche mis palabras y las entienda". ¿Podría explicar por qué votó para cerrar? – Polynomial
No lo es. ¿Necesita ver a un terapeuta del habla? (¿Incluso hacen reconocimiento de voz?) –
No he marcado para cerrar, pero puedo ver por qué otros tienen. Probablemente se ajuste a lo siguiente: * esta pregunta probablemente solicitará opinión, debate, argumentos, encuestas o discusiones extensas. * –