Me gustaría señalar que hay situaciones en las que es perfectamente aceptable utilizar jQuery para raspar pantallas entre dominios. Los gadgets de la barra lateral de Windows se ejecutan en una "zona de máquina local" que permite secuencias de comandos de dominio cruzado.
Y jQuery tiene la capacidad de aplicar selectores al contenido html recuperado. Solo necesita agregar el selector a un parámetro url del método load() después de un espacio.
El siguiente ejemplo de código de gadget comprueba esta página cada hora e informa el número total de visitas a la página.
<html>
<head>
<script type="text/javascript" src="jquery.min.js"></script>
<style>
body {
height: 120px;
width: 130px;
background-color: white;
};
</style>
</head>
<body>
Question Viewed:
<div id="data"></div>
<script type="text/javascript">
var url = "http://stackoverflow.com/questions/1936495/website-scraping-using-jquery-and-ajax"
updateGadget();
inervalID = setInterval("updateGadget();", 60 * 1000);
function updateGadget(){
$(document).ready(function(){
$("#data").load(url + " .label-value:contains('times')");
});
}
</script>
</body>
</html>
quién HTML es lo que desea modificar? ¿Tienes derechos de escritura sobre esa URL? –
Tenga en cuenta que también es posible (ahora) hacer algo similar con nodejs + jsdom. – HoverHell