2010-12-05 11 views

Respuesta

6

Están utilizando su propia API para reconocimiento de voz. Ejemplo: enviar una solicitud de publicación a sus servidores.

12

Sí, Chrome reconoce el habla a través de los servidores de Google. Pero no hay ninguna razón para que otros navegadores no puedan elegir implementarlo de manera diferente (por ejemplo, utilizando alguna función de reconocimiento de voz en el sistema operativo).

Balu, su enlace está un poco desactualizado. La última propuesta de Google se pueden encontrar aquí: http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html

Aunque el reconocimiento de voz ha estado disponible en el canal de desarrolladores de Chrome desde hace algún tiempo, tiene no todavía envían y no estamos todavía seguros de cuándo se va a enviar. Definitivamente queremos que la gente juegue con la API y ofrezca comentarios al respecto, pero no creemos que ya esté lista para el horario estelar.

+3

Existen serias preocupaciones de privacidad aquí. –

0

Acabo de confirmar esto en mi Chrome Cr-48, funciona.

9

De acuerdo con el código que envía los datos de audio como una solicitud POST a:

https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3 

lm es grammar en el código, xhw es hardware_info que es opcional de acuerdo con un comentario. El audio parece ser speex,-speex-con-header-byte x:

// Encode the frame and place the size of the frame as the first byte. This 
// is the packet format for MIME type x-speex-with-header-byte. 

Parece que sería bastante trivial para modificar el código de Chrome para utilizar en su propia aplicación.

Actualización:

también es necesario para obtener una speech recognition API key y son limitada a 50 solicitudes por día. No hay forma de aumentar ese límite, ni siquiera pagando.

+2

¿Alguien sabe si Google está de acuerdo con que esta API sea utilizada directamente por cualquier persona, o si va en contra de los términos y condiciones? Gracias. – poshaughnessy

+0

¿Alguien sabe cómo funciona el atributo "lm" (gramática)? El borrador del W3C establece que la gramática puede ser cualquier URL al archivo GRXML, pero no cambia nada. – hamczu

1

Sí, Chrome no tiene soporte de voz incorporado a través WebKit; solo mira la página de inicio de Google (que ahora tiene un micrófono a la derecha del cuadro de búsqueda). Sin embargo, me pregunto si el equipo de Chrome está trabajando en el soporte de voz Omnibox. ¡Después de todo, Chrome es un navegador basado en WebKit!

6

Hay una bifurcación experimental de speexenc que puede codificar el formato binario MIME de x-speex-with-header-byte, se hace referencia en el QXIP Wiki y está disponible en GitHub. Funciona bien al colocar el tamaño del marco como el primer byte de paquetes.

+0

¡Muchas gracias por eso! – David

Cuestiones relacionadas