Estoy tratando de hacer un webcraper. Lo hice en mi máquina local y funciona muy bien allí. Cuando ejecuto el mismo en mi servidor, muestra un 403 error prohibido. Estoy usando el PHP Simple HTML DOM Parser. El error que consigo en el servidor es la siguiente:file_get_contents devuelve 403 prohibido
Advertencia: file_get_contents (http://example.com/viewProperty.html?id=7715888) [function.file-get-contents]: No se pudo para abrir la secuencia: ¡la solicitud HTTP falló! HTTP/1.1 403 Forbidden en /home/scraping/simple_html_dom.php en línea 40
La línea de código de activación es:
$url="http://www.example.com/viewProperty.html?id=".$id;
$html=file_get_html($url);
He comprobado el php.ini en el servidor y allow_url_fopen está activado. La posible solución puede ser usar curl, pero necesito saber dónde me estoy equivocando.
¿Es el servidor tuyo? Si es así, parece que usted o su servicio de alojamiento han configurado la seguridad para evitar que se elimine. –
No es 'mi' servidor, pero es un servidor dedicado. – absk
He leído mal la pregunta. Pensé que estaba eliminando su propio sitio (es decir, un sitio que tiene permiso explícito para raspar). @Pekka tiene razón. –