Estoy obteniendo información a través de PHP desde una página web usando simple_php_dom
y curl. El problema es que la página no está construida correctamente, por lo que el objeto DOM contiene información errónea.¿Cómo puedo obtener una página HTML como una cadena a través de PHP?
¿Cómo puedo obtener el archivo HTML como una cadena en una var PHP para que pueda ejecutar una expresión regular a través de él?
Curl no funciona ya que está ignorando la parte defectuosa.
simple_html_dom.php
tiene el mismo problema.
wget
no funciona, ya que no tengo permisos para ello en el servidor.
Eso es lo que sugeriría. – Christian
Solo funciona si allow_url_fopen está habilitado. Realmente no hay ninguna razón por la que esto funcione con curl también. –
También ignora parte del archivo: S El único que realmente obtiene el archivo correctamente es wget, que no puedo usar: S – fmsf