Tengo un script Perl que usa LWP::UserAgent para descargar una página web que luego procesa usando expresiones regulares. El problema es que partes de la página web que son HTML normales no se devuelven a LWP :: UserAgent ya que el sitio reconoce que el navegador no tiene Flash instalado y en su lugar devuelve HTML solicitándonos que descarguemos Flash en lugar del HTML apropiado que necesitamos analizar.¿Cómo puedo hacer que LWP :: UserAgent parezca tener Flash instalado?
¿Cómo puedo hacer que LWP :: UserAgent parezca tener flash instalado en el servidor web desde el que estamos solicitando la página? Estoy utilizando el siguiente código para inicializar LWP :: UserAgent:
use LWP::UserAgent;
my $ua = LWP::UserAgent->new(cookie_jar => { },requests_redirectable => [ ]);
$ua->agent('Mozilla/5.0 (X11; U; FreeBSD i386; en-US; rv:9.9.9.9) Gecko/20079999 Firefox/2.0.0.1');
$ua->timeout(10);
Gracias de antemano por su ayuda!
"descargue una página web que luego procesa utilizando expresiones regulares". Oh hombre. – jrockway
Echa un vistazo a esta página: http://stackoverflow.com/questions/2124560/how-can-i-make-lwpuseragent-look-like-another-browser/2124775#2124775 Donde respondo esta pregunta. En resumen, si la detección se realiza en el encabezado Accept/User-Agent, esto es simple. Si la detección se realiza con flash o javascript, podría ser más difícil. Sin embargo, de cualquier manera, necesita saber lo que está enviando al servidor y lo que está recibiendo. –