2011-02-08 13 views
5

¿Cómo implementaron texto a voz (TTS)? ¿Hay una API abierta y gratuita para la síntesis de TTS? Sé sobre Google Translate, pero la licencia no está clara para mí (otro problema es que bloquean una solicitud si contiene una referencia). ¿Alguna idea?Texto a voz en Quizlet.com

Respuesta

0

Google acaba de presentar el acceso basado en navegador a su motor de voz a través de HTML5.

http://slides.html5rocks.com/#speech-input

Para obtener esta página funcione, que puso en marcha el navegador Chromium en Ubuntu de la siguiente manera:

$ chromium-browser --enable-speech-input 

No estoy seguro de si esto funciona en otros sistemas operativos.

Otro proyecto interesante es WAMI del MIT:

http://wami.csail.mit.edu

+0

Esto está en el lado de reconocimiento de voz en lugar del lado de TTS que el OP estaba preguntando. Quizlet también está usando WAMI de MIT. – philfreo

2

Las voces suenan exactamente igual que http://www.neospeech.com. Además, su lista de idiomas coincide exactamente.

No es gratis, debe licenciarlo.

0

No sé qué motor de prueba específico está utilizando, pero suponiendo que esté utilizando un servicio gratuito, entonces podría ser TTS-API (http://tts-api.com/) que apareció recientemente en Hacker News.

Por lo que sé, es la única API web de TTS "libre de usar" que existe. Comente a continuación si me equivoco. Me encantaría encontrar servicios gratuitos. Hay muchos servicios de pago solo pero muy pocos realmente gratuitos.

Desde que averigüé sobre TTS-API en HN lo he utilizado con éxito en un proyecto de aplicación reciente. Como el TTS está a solo un alcance HTTP, pude integrarlo rápidamente en las versiones de iOS y Android de mi aplicación. El servicio parece ser muy rápido, por lo que no hay quejas hasta el momento :-)

0

Nadie dio la respuesta correcta. Tienen su propio motor TTS que está conectado a un solo archivo ubicado en http://quizlet.com/tts/en.mp3, el archivo toma argumentos con él para que la url http://quizlet.com/tts/en.mp3?v=14&b=QXJlYSBvZiBwYXJhbGxlbG9ncmFt&s=m5dx52Q. dice "Área de paralelogramo" gracias a la primera cadena de base64 etiquetada como b. No he descubierto para qué v o s se utilizan, pero sé que son esenciales para hacer que el archivo hable. Haré más investigación y volveré a esta respuesta.

0

jj b es correcto. El motor principal de las funciones de voz de Quizlet es Neospeech, y usa el VTML de Neospeech (VoiceText [TM] Markup Language) exactamente, por lo que yo sé.

+0

Esto hubiera sido más apropiado como un comentario sobre la respuesta existente de jj b (o como todavía no puedes comentar sobre respuestas que no son tuyas, un simple * voto favorable * hubiera sido apropiado). – JonK

Cuestiones relacionadas