Sé cómo obtener el código fuente html a través de cUrl, pero quiero eliminar los comentarios en el documento html (me refiero a lo que está entre <!-- .. -->
). Además, si puedo tomar solo el BODY
del documento html. gracias.eliminar comentarios del código fuente html
Respuesta
Trate PHP DOM*:
$html = '<html><body><!--a comment--><div>some content</div></body></html>'; // put your cURL result here
$dom = new DOMDocument;
$dom->loadHtml($html);
$xpath = new DOMXPath($dom);
foreach ($xpath->query('//comment()') as $comment) {
$comment->parentNode->removeChild($comment);
}
$body = $xpath->query('//body')->item(0);
$newHtml = $body instanceof DOMNode ? $dom->saveXml($body) : 'something failed';
var_dump($newHtml);
Salida:
string(36) "<body><div>some content</div></body>"
Mira que está funcionando bien, nunca he hablado sobre DOM. gracias. – Luis
Si no hay opción para esto en rizo (y sospecho que no es, pero me he equivocado antes), entonces usted puede por lo menos analizar el HTML resultante al contenido de su corazón con un PHPDOMparser.
Probablemente esta sea su mejor apuesta a largo plazo en términos de capacidad de configuración y soporte.
Correcto, no hay tal opción en el curl. Simplemente obtiene los datos cuando el servidor los envía. –
lo haría tubería a sed de una expresión regular, algo así como
curl http://yoururl.com/test.html | sed -i "s/<!\-\-\s?\w+\s?\-\->//g" | sed "s/.?(<body>.?</body>).?/\1/"
Las expresiones regulares pueden no ser exactos, pero usted consigue la idea ...
- 1. Eliminar comentarios HTML
- 2. RegExp para eliminar comentarios HTML
- 3. Código fuente de haskell con bastante impresión con comentarios
- 4. ¿Es posible evitar que los comentarios HTML estándar aparezcan en el código fuente?
- 5. Eliminar los comentarios de inner_html
- 6. Cómo cifrar la salida del código fuente HTML usando PHP
- 7. Regex para eliminar comentarios condicionales
- 8. php: Obtener código fuente html con cURL
- 9. C# Cómo eliminar comentarios XML/HTML con la expresión regular
- 10. ¿Cómo puedo eliminar comentarios HTML en mis Facelets?
- 11. Traduciendo comentarios y nombres de regiones en el código fuente
- 12. ¿Cómo resaltar el código fuente en HTML?
- 13. Obtener código fuente HTML como una cadena
- 14. ¿Comentarios HTML dentro de los comentarios?
- 15. HTML Comentarios Marcado
- 16. ¿Comentarios HTML en CSS?
- 17. ¿Cómo puedo quitar los comentarios y las cadenas de documentación del código fuente de Python?
- 18. obteniendo el offset del elemento html seleccionado relacionado con el código fuente html con js
- 19. Wicket: ocultar comentarios en HTML
- 20. ¿Quitar los comentarios del archivo fuente usando IntelliJ?
- 21. Los comentarios HTML se descomponen
- 22. Cómo mantener la salida html PHP 'Ver código fuente' limpia
- 23. ¿Puedo eliminar dependencias ANTLR del código generado?
- 24. Analizador de código estático para código fuente Java para extraer métodos/comentarios
- 25. ¿Cómo puedo obtener el código fuente HTML de TWebBrowser
- 26. CSS - comentarios de código más inteligente
- 27. comentarios HTML dentro de la etiqueta de apertura del elemento
- 28. Cómo buscar comentarios ("<!-- -->") con Jsoup?
- 29. Agregar imágenes al código fuente
- 30. Eliminar texto del documento HTML con Ruby
debe volver a analizarlos manualmente ... Tengo mi propia biblioteca de JavaScript para eso, pero no sé cómo podría implementar eso en PHP – metaforce
no hay una opción de cUrl para esto? – Luis
No lo creo así ... – metaforce