Estoy tratando de analizar un documento y obtener todas las etiquetas de imagen y cambiar el origen de algo diferente.php DomDocument agrega etiquetas adicionales
$domDocument = new DOMDocument();
$domDocument->loadHTML($text);
$imageNodeList = $domDocument->getElementsByTagName('img');
foreach ($imageNodeList as $Image) {
$Image->setAttribute('src', 'lalala');
$domDocument->saveHTML($Image);
}
$text = $domDocument->saveHTML();
El texto inicialmente $ tiene el siguiente aspecto:
<p>Hi, this is a test, here is an image<img src="http://mysite.com/beer.jpg" width="60" height="95" /> Because I like Beer!</p>
y este es el texto de salida $:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body><p>Hi, this is a test, here is an image<img src="lalala" width="68" height="95"> Because I like Beer!</p></body></html>
Me estoy poniendo un montón de etiquetas adicionales (html, cuerpo , y el comentario en la parte superior) que realmente no necesito. ¿Alguna forma de configurar DOMDocument para evitar agregar estas etiquetas adicionales?
¡Gracias!
debería leer: $ text = preg_replace ('/^ /', '', str_replace (array ('', '', '
', ''), array ('', '', ' ',' '), $ domDocument-> saveHTML())); –'preg_replace', ¿en serio? – sglessard