2010-07-22 18 views
24

Estoy un poco confundido acerca de cómo funciona reCAPTCHA. Lo he implementado usando ROR.reCAPTCHA aceptando una palabra de dos

A veces, incluso si especifico solo una palabra de dos, devuelve true mientras que a veces falla.

Estoy realmente confundido y no puedo entender el comportamiento de reCAPTCHA.

Respuesta

17

Solo una de las palabras de recaptcha es "conocida" por el sistema; se basa en que el usuario que realiza el captcha le diga al sistema cuál es la otra palabra, porque no es legible por máquina.

Ese es el "punto" de recaptcha, o el beneficio adicional: no solo está realizando una prueba humana, también es una traducción masiva de fuentes grupales donde el OCR automático ha fallado.

2

Recaptcha usa dos palabras, una de las cuales es conocida y otra desconocida (la palabra desconocida es la que el programa está intentando ayudar a descifrar; probablemente se escaneó de un libro viejo o algo parecido). Entonces, todo lo que el servicio está buscando es la respuesta correcta a la palabra CONOCIDA. Si esa es la palabra que pones, tendrá éxito incluso si no pones nada por la palabra desconocida. Si pones la otra palabra (la desconocida) fallará.

15

Recaptcha muestra dos palabras. Uno que un escáner de computadora ha escaneado y reconocido y otro que el escáner de la computadora no puede reconocer. Recaptcha busca la palabra a la que conoce la respuesta y guarda la respuesta para la palabra desconocida. Estas respuestas a las palabras desconocidas se compilan y analizan para que sean esencialmente "resueltas" por los humanos y no por el escáner de la computadora.

Aquí hay más información, en sus propias palabras:

"Pero si un equipo no puede leer un CAPTCHA de este tipo, ¿cómo el sistema conoce la respuesta correcta al acertijo He aquí cómo:? Cada nueva palabra que no puede El OCR se le debe leer correctamente a un usuario junto con otra palabra cuya respuesta ya se conoce. Se le pide al usuario que lea ambas palabras. Si resuelven el que conoce la respuesta, el sistema asume su respuesta. es correcto para el nuevo. Luego, el sistema le da la nueva imagen a otras personas para determinar, con mayor confianza, si la respuesta original fue correcta ".

fuente - http://www.google.com/recaptcha/learnmore

+0

¿Está seguro de que el escáner reconoció una de las palabras? ¿No podría usar una palabra que fue resuelta por usuarios anteriores? – Greg

+1

sí. sí utiliza palabras resueltas por usuarios anteriores. una palabra es una que el escáner puede leer y la otra es una que el escáner no puede leer. el que el escáner no lee es resuelto por múltiples usuarios. esto genera un consenso en cuanto a cuál es la palabra correcta (por lo tanto, la "solución" de la palabra desconocida no se basa solo en 1 respuesta. He agregado el enlace a la página recaptcha about en mi respuesta anterior. – programatique

1

creo que es el principal punto de reCAPTCHA. Ayuda a los desarrolladores a hacer la diferencia entre humanos y robots, y también ayuda a digitalizar libros.

Siempre hay dos palabras. Uno es más fácil de leer. Si puedes leer esta palabra, está bien, eres humano.

La segunda palabra es un escaneo de un libro donde el reconocimiento automático de caracteres (reconocimiento) no está seguro de esta palabra. Así que los usuarios están ayudando a leer esta palabra para que los libros se puedan digitalizar mejor.

+0

En realidad ambos son escaneos, pero uno ya ha sido identificado por N usuarios. Una vez que ese número de umbral ha identificado la segunda palabra, se agrega a las conocidas. –