2009-09-16 10 views
9

Mi lectura de este article sugiere que un beneficio de ReCAPTCHA es que los humanos pueden verificar palabras no reconocidas en el OCR/digitalización de libros. Hace esto usando estas palabras en "¿Eres humano?" pruebas. Entonces ReCAPTCHA mata dos pájaros de un tiro. ¡Estupendo!¿Cómo funciona ReCAPTCHA?

Pero no lo entiendo. Si la palabra no puede ser reconocida por el proceso de digitalización, ¿en qué se contrasta la entrada ingresada por el supuesto ser humano? ¿Como funciona esto?

Respuesta

23

Muestra dos palabras. Una de ellas la computadora ya sabe, la otra, no. Supone que si obtienes el derecho conocido, debes conocer al otro.

No sabe cuál de los dos ya se conoce, por lo que, teóricamente, no puede engañarlo. Además, reproducirá una palabra con varias personas para obtener una confirmación independiente antes de enviarla de regreso a la fuente (compañía de periódicos, grupo de escaneo de libros) como una respuesta válida.

Pero si un equipo no puede leer un CAPTCHA de tales , ¿cómo sabe el sistema de la respuesta correcta al acertijo? Aquí está cómo: cada palabra nueva que no se puede leer correctamente por OCR se le da a un usuario en junto con otra palabra para cuya respuesta ya se conoce. El usuario se le pide que lea ambas palabras. Si resuelven aquel para el que se conoce la respuesta , el sistema asume y su respuesta es correcta para el nuevo . El sistema proporciona la nueva imagen a un número de otras personas para determinar, con mayor confianza, si la respuesta original fue correcta.

http://recaptcha.net/learnmore.html

+0

Me gustaría señalar que ReCAPTCHA funciona mostrando dos palabras, una que conoce y otra que no. Solo necesitas obtener uno correcto. Sin embargo, vuelven a enviar el que no varias veces hasta que obtienen un alto porcentaje de que es correcto antes de que lo absorban como tal. –

+0

Buen punto, el sistema no es infalible, aunque es inteligente. Me recuerda el juego Image Labeler de Google, que funciona según los mismos principios para que gente desconocida etiquete imágenes: http://images.google.com/imagelabeler/ –

+0

Imagelabeler y ReCapcha son del mismo tipo: Luis von Ahn. Él realmente lideró el camino en el uso de humanos para resolver problemas difíciles. –

2

citado de LEARN HOW reCAPTCHA WORKS

Pero si un equipo no puede leer un CAPTCHA de este tipo, ¿cómo el sistema conoce la respuesta correcta al acertijo? Aquí se explica cómo: cada palabra nueva que OCR no puede leer correctamente se le da a un usuario junto con otra palabra cuya respuesta ya se conoce. Luego se le pide al usuario que lea ambas palabras. Si resuelven aquel para el que se conoce la respuesta, el sistema supone que su respuesta es la correcta para el nuevo. Luego, el sistema le da la nueva imagen a otras personas para determinar, con mayor confianza, si la respuesta original fue correcta.

Cuestiones relacionadas