¿Tiene Chrome reconocimiento de voz integrado para los elementos de entrada "x-webkit-speech"?

Me pregunto cómo¿Tiene Chrome reconocimiento de voz integrado para los elementos de entrada "x-webkit-speech"?

<input type="text" x-webkit-speech speech />

¿Existe un reconocimiento de voz enging integrado en Chrome o se trata de acceder a un centro de reconocimiento de voz subyacente en el sistema operativo?

Fuente

2010-12-05 Tickle Me Elmo

Presentación de Hacker News en la que probablemente se encuentre ese enlace: http://news.ycombinator.com/item?id=1972855 – balu

El reconocimiento de voz es una propuesta de Google. https://docs.google.com/View?id=dcfg79pz_5dhnp23f5

La característica se envía con Chrome 8+ y parece que envía los datos a los servidores de Google para realizar el reconocimiento real.

Fuente

2010-12-05 23:29:35 balu

Están utilizando su propia API para reconocimiento de voz. Ejemplo: enviar una solicitud de publicación a sus servidores.

Fuente

2010-12-06 00:03:16 ciju

Sí, Chrome reconoce el habla a través de los servidores de Google. Pero no hay ninguna razón para que otros navegadores no puedan elegir implementarlo de manera diferente (por ejemplo, utilizando alguna función de reconocimiento de voz en el sistema operativo).

Balu, su enlace está un poco desactualizado. La última propuesta de Google se pueden encontrar aquí: http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html

Aunque el reconocimiento de voz ha estado disponible en el canal de desarrolladores de Chrome desde hace algún tiempo, tiene no todavía envían y no estamos todavía seguros de cuándo se va a enviar. Definitivamente queremos que la gente juegue con la API y ofrezca comentarios al respecto, pero no creemos que ya esté lista para el horario estelar.

Fuente

2010-12-06 10:42:38 jorlow

Existen serias preocupaciones de privacidad aquí. –

También hay un grupo de trabajo que produjo http://www.w3.org/TR/xhtml+voice/, pero no creo que esto se implemente en ningún navegador excepto Opera.

Fuente

2010-12-06 14:38:56

Acabo de confirmar esto en mi Chrome Cr-48, funciona.

Fuente

2010-12-14 00:51:13

De acuerdo con el código que envía los datos de audio como una solicitud POST a:

https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3

lm es grammar en el código, xhw es hardware_info que es opcional de acuerdo con un comentario. El audio parece ser speex,-speex-con-header-byte x:

// Encode the frame and place the size of the frame as the first byte. This 
// is the packet format for MIME type x-speex-with-header-byte.

Parece que sería bastante trivial para modificar el código de Chrome para utilizar en su propia aplicación.

Actualización:

también es necesario para obtener una speech recognition API key y son limitada a 50 solicitudes por día. No hay forma de aumentar ese límite, ni siquiera pagando.

Fuente

2011-01-05 17:33:14 Timmmm

¿Alguien sabe si Google está de acuerdo con que esta API sea utilizada directamente por cualquier persona, o si va en contra de los términos y condiciones? Gracias. – poshaughnessy

¿Alguien sabe cómo funciona el atributo "lm" (gramática)? El borrador del W3C establece que la gramática puede ser cualquier URL al archivo GRXML, pero no cambia nada. – hamczu

Esta característica ahora funciona en Chrome 11 beta.

mira esto ...

http://slides.html5rocks.com/#speech-input

Fuente

2011-03-24 07:16:46 Jay

Esto podría ser de interés https://github.com/taf2/speech2text fijaciones de rubí para el discurso de Google API de texto

Fuente

2011-03-25 17:26:09 todd

Sí, Chrome no tiene soporte de voz incorporado a través WebKit; solo mira la página de inicio de Google (que ahora tiene un micrófono a la derecha del cuadro de búsqueda). Sin embargo, me pregunto si el equipo de Chrome está trabajando en el soporte de voz Omnibox. ¡Después de todo, Chrome es un navegador basado en WebKit!

Fuente

2011-06-20 02:03:10

Hay una bifurcación experimental de speexenc que puede codificar el formato binario MIME de x-speex-with-header-byte, se hace referencia en el QXIP Wiki y está disponible en GitHub. Funciona bien al colocar el tamaño del marco como el primer byte de paquetes.

Fuente

2012-02-09 19:21:36

¡Muchas gracias por eso! – David

¿Tiene Chrome reconocimiento de voz integrado para los elementos de entrada "x-webkit-speech"?

Respuesta

Cuestiones relacionadas