Armado un rápido navegador WinForm/embedded IE que inicia sesión en el sitio web de nuestra compañía todas las mañanas y raspa/exporta la información de depósito deseada (el banco es un banco regional pequeño). Dado que tenemos unas pocas docenas de "pseudoaccounts" que provienen de la misma cuenta maestra, esto realmente demora de 10 a 15 minutos en recuperarse.OCR un llavero RSA (token de seguridad)
De todos modos, el único problema es que nuestra cuenta bancaria comercial necesita un token de seguridad RSA (http://www.rsa.com/node.aspx?id=1156)--if no está familiarizado, es un dispositivo pequeño que muestra un número aleatorio de 6 dígitos cada 15 (?) Segundos, así que tengo que solicite este valor antes de comenzar. Esto se encuentra en la parte superior del modelo de seguridad basado en el inicio de sesión del sitio web, por lo que incluso si crea una cuenta de solo lectura que no puede hacer nada, aún debe ingresar el número RSA. Tenemos 5 de estos tokens para diferentes personas en la compañía
Desde nuestra perspectiva esto es seguridad de nusiance. Estaba bromeando sobre el uso de una cámara web para OCR los dígitos del llavero para que no tuvieran que escribirlo - principalmente para que el raspado/exportación se haga antes de que alguien llegue por la mañana. Bueno, ellos como ked si realmente pudiera hacerlo.
Así que ahora te pregunto, ¿qué tan difícil (cuántas horas) crees que le tomará al OCR estos dígitos de manera confiable a partir de una imagen JPEG producida por la cámara? Ya sé que puedo obtener el JPEG fácilmente. Creo que tienes 3 intentos para iniciar sesión, por lo que realmente necesita alcanzar una tasa de precisión del 99%. Podría trabajar en esto en mi tiempo libre, pero no quieren que dedique más de unas horas, así que quiero aprovechar la mayor cantidad posible de código. Esta es una pantalla de 7 segmentos (como un reloj de alarma) por lo que no es exactamente el texto que un paquete de OCR estaría acostumbrado a ver.
Además, hay un temporizador de cuenta regresiva en el costado de la pantalla; por lo general, cuando baja a 1 bar, esperas hasta que aparezca el siguiente número y comienza de nuevo a 5 bares (como la potencia de la señal en tu teléfono celular). Entonces, esto también debería ser OCRd, pero no es texto.
De todos modos, cuanto más lo pienso mientras escribo esto, menos convencido estoy de que realmente pueda hacer esto bien, ¿entonces quizás debería trabajar en ello en mi tiempo libre?
Por supuesto * se puede * hacer, pero ¿para qué molestarse? Simplemente escriba los malditos dígitos y guarde su mejor trabajo para algo útil. –
Siempre es una gran idea que todo Internet sepa que una computadora en su oficina se registra automáticamente en su cuenta bancaria comercial a una determinada hora todos los días cuando no hay nadie más cerca. –