phantomjs no está esperando la carga de la página "completa"

12

Quizás pueda usar el onResourceRequested and onResourceReceived callbacks para detectar la carga asíncrona. He aquí un ejemplo del uso de estas devoluciones de llamada from their documentation:

var page = require('webpage').create(); 
page.onResourceRequested = function (request) { 
    console.log('Request ' + JSON.stringify(request, undefined, 4)); 
}; 
page.onResourceReceived = function (response) { 
    console.log('Receive ' + JSON.stringify(response, undefined, 4)); 
}; 
page.open(url);

Además, se puede ver en examples/netsniff.js para un ejemplo de trabajo.

Fuente

2012-07-05 08:04:05 Supr

+0

Pero en este caso no puedo usar una instancia de PhantomJS para cargar más de una página a la vez, ¿verdad? – nilfalse

+0

¿onResourceRequested se aplica a solicitudes AJAX/Cross Domain? ¿O se aplica solo a css, imágenes, etc.? – CMCDragonkai

+0

@CMCDragonkai Nunca lo he usado, pero basado en [esto] (https://github.com/ariya/phantomjs/wiki/Network-Monitoring) parece que incluye todas las solicitudes. Cita: 'Todas las solicitudes y respuestas de recursos pueden ser olidas usando onResourceRequested y onResourceReceived' – Supr

18

Usted podría tratar de una combinación de los ejemplos WAITFOR y rasterize:

/** 
* See https://github.com/ariya/phantomjs/blob/master/examples/waitfor.js 
* 
* Wait until the test condition is true or a timeout occurs. Useful for waiting 
* on a server response or for a ui change (fadeIn, etc.) to occur. 
* 
* @param testFx javascript condition that evaluates to a boolean, 
* it can be passed in as a string (e.g.: "1 == 1" or "$('#bar').is(':visible')" or 
* as a callback function. 
* @param onReady what to do when testFx condition is fulfilled, 
* it can be passed in as a string (e.g.: "1 == 1" or "$('#bar').is(':visible')" or 
* as a callback function. 
* @param timeOutMillis the max amount of time to wait. If not specified, 3 sec is used. 
*/ 
function waitFor(testFx, onReady, timeOutMillis) { 
    var maxtimeOutMillis = timeOutMillis ? timeOutMillis : 3000, //< Default Max Timout is 3s 
     start = new Date().getTime(), 
     condition = (typeof(testFx) === "string" ? eval(testFx) : testFx()), //< defensive code 
     interval = setInterval(function() { 
      if ((new Date().getTime() - start < maxtimeOutMillis) && !condition) { 
       // If not time-out yet and condition not yet fulfilled 
       condition = (typeof(testFx) === "string" ? eval(testFx) : testFx()); //< defensive code 
      } else { 
       if(!condition) { 
        // If condition still not fulfilled (timeout but condition is 'false') 
        console.log("'waitFor()' timeout"); 
        phantom.exit(1); 
       } else { 
        // Condition fulfilled (timeout and/or condition is 'true') 
        console.log("'waitFor()' finished in " + (new Date().getTime() - start) + "ms."); 
        typeof(onReady) === "string" ? eval(onReady) : onReady(); //< Do what it's supposed to do once the condition is fulfilled 
        clearInterval(interval); //< Stop this interval 
       } 
      } 
     }, 250); //< repeat check every 250ms 
}; 

var page = require('webpage').create(), system = require('system'), address, output, size; 

if (system.args.length < 3 || system.args.length > 5) { 
    console.log('Usage: rasterize.js URL filename [paperwidth*paperheight|paperformat] [zoom]'); 
    console.log(' paper (pdf output) examples: "5in*7.5in", "10cm*20cm", "A4", "Letter"'); 
    phantom.exit(1); 
} else { 
    address = system.args[1]; 
    output = system.args[2]; 
    if (system.args.length > 3 && system.args[2].substr(-4) === ".pdf") { 
     size = system.args[3].split('*'); 
     page.paperSize = size.length === 2 ? { 
      width : size[0], 
      height : size[1], 
      margin : '0px' 
     } : { 
      format : system.args[3], 
      orientation : 'portrait', 
      margin : { 
       left : "5mm", 
       top : "8mm", 
       right : "5mm", 
       bottom : "9mm" 
      } 
     }; 
    } 
    if (system.args.length > 4) { 
     page.zoomFactor = system.args[4]; 
    } 
    var resources = []; 
    page.onResourceRequested = function(request) { 
     resources[request.id] = request.stage; 
    }; 
    page.onResourceReceived = function(response) { 
     resources[response.id] = response.stage; 
    }; 
    page.open(address, function(status) { 
     if (status !== 'success') { 
      console.log('Unable to load the address!'); 
      phantom.exit(); 
     } else { 
      waitFor(function() { 
       // Check in the page if a specific element is now visible 
       for (var i = 1; i < resources.length; ++i) { 
        if (resources[i] != 'end') { 
         return false; 
        } 
       } 
       return true; 
      }, function() { 
       page.render(output); 
       phantom.exit(); 
      }, 10000); 
     } 
    }); 
}

Fuente

2013-02-07 10:32:31 rhunwicks

+3

Parece que no funcionaría con páginas web que usan cualquiera de las tecnologías push del servidor, ya que el recurso todavía estará en uso después de que se produzca onLoad. – nilfalse

+0

Haga cualquier controlador, ej. [poltergeist] (https://github.com/jonleighton/poltergeist), ¿tiene una función como esta? –

+0

¿Es posible usar waitFor para sondear todo el texto html y buscar una palabra clave definida? Traté de implementar esto, pero parece que el sondeo no se actualiza a la última fuente html descargada. – fpdragon

66

Otro enfoque es simplemente pregunta PhantomJS que esperar un poco después de que la página se ha cargado antes de hacer el render, según la regularidad rasterize.js ejemplo, pero con un tiempo de espera más largo para permitir que el JavaScript para terminar de cargar los recursos adicionales:

page.open(address, function (status) { 
    if (status !== 'success') { 
     console.log('Unable to load the address!'); 
     phantom.exit(); 
    } else { 
     window.setTimeout(function() { 
      page.render(output); 
      phantom.exit(); 
     }, 1000); // Change timeout as required to allow sufficient time 
    } 
});

Fuente

2013-02-07 10:36:54 rhunwicks

+1

Sí, actualmente me atiendo a este enfoque. – nilfalse

+7

Debe aceptar la respuesta – alex88

+89

Es una solución horrible, lo siento (¡es culpa de PhantomJS!). Si espera un segundo completo, pero tarda 20 ms en cargarse, es una pérdida de tiempo completa (piense en trabajos por lotes), o si tarda más de un segundo, seguirá fallando. Tal ineficiencia y falta de fiabilidad es insoportable para el trabajo profesional. – CoDEmanX

13

En mi programa, yo uso un poco de lógica para juzgar si era onload: ver su solicitud de red, si no había ninguna solicitud nueva en los últimos 200ms, tre en ello onload.

Utilice esto, después de onLoadFinish().

function onLoadComplete(page, callback){ 
    var waiting = []; // request id 
    var interval = 200; //ms time waiting new request 
    var timer = setTimeout(timeout, interval); 
    var max_retry = 3; // 
    var counter_retry = 0; 

    function timeout(){ 
     if(waiting.length && counter_retry < max_retry){ 
      timer = setTimeout(timeout, interval); 
      counter_retry++; 
      return; 
     }else{ 
      try{ 
       callback(null, page); 
      }catch(e){} 
     } 
    } 

    //for debug, log time cost 
    var tlogger = {}; 

    bindEvent(page, 'request', function(req){ 
     waiting.push(req.id); 
    }); 

    bindEvent(page, 'receive', function (res) { 
     var cT = res.contentType; 
     if(!cT){ 
      console.log('[contentType] ', cT, ' [url] ', res.url); 
     } 
     if(!cT) return remove(res.id); 
     if(cT.indexOf('application') * cT.indexOf('text') != 0) return remove(res.id); 

     if (res.stage === 'start') { 
      console.log('!!received start: ', res.id); 
      //console.log(JSON.stringify(res)); 
      tlogger[res.id] = new Date(); 
     }else if (res.stage === 'end') { 
      console.log('!!received end: ', res.id, (new Date() - tlogger[res.id])); 
      //console.log(JSON.stringify(res)); 
      remove(res.id); 

      clearTimeout(timer); 
      timer = setTimeout(timeout, interval); 
     } 

    }); 

    bindEvent(page, 'error', function(err){ 
     remove(err.id); 
     if(waiting.length === 0){ 
      counter_retry = 0; 
     } 
    }); 

    function remove(id){ 
     var i = waiting.indexOf(id); 
     if(i < 0){ 
      return; 
     }else{ 
      waiting.splice(i,1); 
     } 
    } 

    function bindEvent(page, evt, cb){ 
     switch(evt){ 
      case 'request': 
       page.onResourceRequested = cb; 
       break; 
      case 'receive': 
       page.onResourceReceived = cb; 
       break; 
      case 'error': 
       page.onResourceError = cb; 
       break; 
      case 'timeout': 
       page.onResourceTimeout = cb; 
       break; 
     } 
    } 
}

Fuente

2014-01-28 09:28:34 deemstone

47

yo preferiría comprobar periódicamente document.readyState de estado (https://developer.mozilla.org/en-US/docs/Web/API/document.readyState). Aunque este enfoque es un poco torpe, puede estar seguro de que dentro de la función onPageReady está utilizando un documento completamente cargado.

var page = require("webpage").create(), 
    url = "http://example.com/index.html"; 

function onPageReady() { 
    var htmlContent = page.evaluate(function() { 
     return document.documentElement.outerHTML; 
    }); 

    console.log(htmlContent); 

    phantom.exit(); 
} 

page.open(url, function (status) { 
    function checkReadyState() { 
     setTimeout(function() { 
      var readyState = page.evaluate(function() { 
       return document.readyState; 
      }); 

      if ("complete" === readyState) { 
       onPageReady(); 
      } else { 
       checkReadyState(); 
      } 
     }); 
    } 

    checkReadyState(); 
});

explicación adicional:

anidadas utilizando setTimeout en lugar de setInterval impide checkReadyState de "solapamiento" y las condiciones de carrera cuando su ejecución se prolonga por algunas razones aleatorias. setTimeout tiene un retraso predeterminado de 4 ms (https://stackoverflow.com/a/3580085/1011156) por lo que el sondeo activo no afectará drásticamente el rendimiento del programa.

document.readyState === "complete" significa que el documento está completamente cargado con todos los recursos (https://html.spec.whatwg.org/multipage/dom.html#current-document-readiness).

Fuente

2014-12-14 18:50:22

+4

el comentario sobre setTimeout vs setInterval es genial. –

+0

'readyState' solo se activará una vez que el DOM se haya cargado por completo, sin embargo, cualquier elemento' 'aún se puede cargar, por lo que realmente no responde la pregunta original – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/571194/">CodingIntrigue</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+1</span></div> <div class="col-lg-11"> <p class="commenttext">@rgraham No es ideal, pero creo que solo podemos hacer tanto con estos renderizadores. Habrá casos extremos en los que simplemente no sabrás si algo está cargado completamente. Piense en una página donde el contenido se retrasa, a propósito, por un minuto o dos. No es razonable esperar que el proceso de representación se quede sentado y espere un tiempo indefinido. Lo mismo ocurre con el contenido cargado de fuentes externas que puede ser lento. – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">11<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>me encontré con este enfoque útil en algunos casos:</p> <pre><code class="prettyprint-override">page.onConsoleMessage(function(msg) { // do something e.g. page.render }); </code></pre> <p>que si es el propietario de la página poner un poco de la escritura en el interior:</p> <pre><code class="prettyprint-override"><script> window.onload = function(){ console.log('page loaded'); } </script> </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/30805396">Fuente</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2015-06-12 14:23:03</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/855130/">Brankodd</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div>  <div class="comments"> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">Esto parece una muy buena solución, sin embargo, no pude obtener ningún mensaje de registro de mi página HTML/JavaScript para pasar a través de fantasmaJS ... el evento onConsoleMessage nunca se activó mientras podía ver los mensajes perfectamente en la consola del navegador. y no tengo idea de por qué. – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/2545732/">Dirk</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+1</span></div> <div class="col-lg-11"> <p class="commenttext">Necesitaba page.onConsoleMessage = function (msg) {}; – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">3<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>encontré esta solución útil en una aplicación NodeJS. Lo uso solo en casos desesperados porque inicia un tiempo de espera para esperar la carga de la página completa.</p> <p>El segundo argumento es la función de devolución de llamada que se llamará una vez que la respuesta esté lista.</p> <pre><code class="prettyprint-override">phantom = require('phantom'); var fullLoad = function(anUrl, callbackDone) { phantom.create(function (ph) { ph.createPage(function (page) { page.open(anUrl, function (status) { if (status !== 'success') { console.error("pahtom: error opening " + anUrl, status); ph.exit(); } else { // timeOut global.setTimeout(function() { page.evaluate(function() { return document.documentElement.innerHTML; }, function (result) { ph.exit(); // EXTREMLY IMPORTANT callbackDone(result); // callback }); }, 5000); } }); }); }); } var callback = function(htmlBody) { // do smth with the htmlBody } fullLoad('your/url/', callback); </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/30918596">Fuente</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2015-06-18 14:44:10</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/1614677/">Manu</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1038284119" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">2<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>Ésta es una vieja pregunta, pero como yo estaba buscando carga de página completa pero para Spookyjs (que utiliza casperjs y PhantomJS) y no encontré mi solución, que hizo que mi propio guión para que, con la mismo enfoque que el usuario deemstone. Lo que hace este enfoque es, para una cantidad de tiempo dada, si la página no recibió o no inició ninguna solicitud, terminará la ejecución.</p> <p>El archivo casper.js (si se ha instalado en todo el mundo, el camino sería algo así como /usr/local/lib/node_modules/casperjs/modules/casper.js) añadir las siguientes líneas:</p> <p>Al parte superior del archivo con todos los VARs globales:</p> <pre><code class="prettyprint-override">var waitResponseInterval = 500 var reqResInterval = null var reqResFinished = false var resetTimeout = function() {} </code></pre> <p>Entonces función dentro "createpage (Casper)" justo después de "página var = require ('página web') crear();". añadir el siguiente código:</p> <pre><code class="prettyprint-override">resetTimeout = function() { if(reqResInterval) clearTimeout(reqResInterval) reqResInterval = setTimeout(function(){ reqResFinished = true page.onLoadFinished("success") },waitResponseInterval) } resetTimeout() </code></pre> <p>A continuación, en el interior "page.onResourceReceived = función onResourceReceived (recurso) {" en la primera línea añadir:</p> <pre><code class="prettyprint-override">resetTimeout() </code></pre> <p>hacer lo mismo para "page.onResourceRequested = función onResourceRequested (RequestData, solicitud) {"</p> <p>Finalmente, el "page.onLoadFinished = función onLoadFinished (status) {" en la primera línea add:</p> <pre><code class="prettyprint-override">if(!reqResFinished) { return } reqResFinished = false </code></pre> <p>Y eso es todo, espero que esto ayude a alguien en problemas como yo. Esta solución es para casperjs pero funciona directamente para Spooky.</p> <p>¡Buena suerte!</p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/35065763">Fuente</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2016-01-28 15:40:27</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/2687671/">fdnieves</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">3<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>Esta es una implementación de la respuesta de Supr. También usa setTimeout en lugar de setInterval como sugirió Mateusz Charytoniuk.</p> <p>Phantomjs saldrá en 1000 ms cuando no haya ninguna solicitud o respuesta.</p> <pre><code class="prettyprint-override">// load the module var webpage = require('webpage'); // get timestamp function getTimestamp(){ // or use Date.now() return new Date().getTime(); } var lastTimestamp = getTimestamp(); var page = webpage.create(); page.onResourceRequested = function(request) { // update the timestamp when there is a request lastTimestamp = getTimestamp(); }; page.onResourceReceived = function(response) { // update the timestamp when there is a response lastTimestamp = getTimestamp(); }; page.open(html, function(status) { if (status !== 'success') { // exit if it fails to load the page phantom.exit(1); } else{ // do something here } }); function checkReadyState() { setTimeout(function() { var curentTimestamp = getTimestamp(); if(curentTimestamp-lastTimestamp>1000){ // exit if there isn't request or response in 1000ms phantom.exit(); } else{ checkReadyState(); } }, 100); } checkReadyState(); </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/38132403">Fuente</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2016-06-30 20:11:38</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/2291327/">Dayong</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">3<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>Este código que utilizo:</p> <pre><code class="prettyprint-override">var system = require('system'); var page = require('webpage').create(); page.open('http://....', function(){ console.log(page.content); var k = 0; var loop = setInterval(function(){ var qrcode = page.evaluate(function(s) { return document.querySelector(s).src; }, '.qrcode img'); k++; if (qrcode){ console.log('dataURI:', qrcode); clearInterval(loop); phantom.exit(); } if (k === 50) phantom.exit(); // 10 sec timeout }, 200); }); </code></pre> <p>Básicamente dado el hecho de que se supone que saber que la página está llena descargada cuando aparece un elemento dado en el DOM. Entonces, el script esperará hasta que esto suceda.</p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/38149362">Fuente</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2016-07-01 15:44:44</span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1038284119" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">11<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>Aquí hay una solución que espera a que se completen todas las solicitudes de recursos. Una vez completado, registrará el contenido de la página en la consola y generará una captura de pantalla de la página renderizada.</p> <p>Aunque esta solución puede servir como un buen punto de partida, he observado que falla, ¡así que definitivamente no es una solución completa!</p> <p>No tuve mucha suerte usando <code class="prettyprint-override">document.readyState</code>.</p> <p>Fui influenciado por el ejemplo <a href="https://github.com/ariya/phantomjs/blob/master/examples/waitfor.js">waitfor.js</a> que se encuentra en el <a href="http://phantomjs.org/examples/index.html" title="phantomjs examples page">phantomjs examples page</a>.</p> <pre><code class="prettyprint-override">var system = require('system'); var webPage = require('webpage'); var page = webPage.create(); var url = system.args[1]; page.viewportSize = { width: 1280, height: 720 }; var requestsArray = []; page.onResourceRequested = function(requestData, networkRequest) { requestsArray.push(requestData.id); }; page.onResourceReceived = function(response) { var index = requestsArray.indexOf(response.id); requestsArray.splice(index, 1); }; page.open(url, function(status) { var interval = setInterval(function() { if (requestsArray.length === 0) { clearInterval(interval); var content = page.content; console.log(content); page.render('yourLoadedPage.png'); phantom.exit(); } }, 500); }); </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/38468106">Fuente</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2016-07-19 20:40:01</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/2863609/">Dave</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div>  <div class="comments"> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">Dio un pulgar hacia arriba, pero usó setTimeout con 10, en lugar del intervalo – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/25286/">GDmac</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">Debe verificar que response.stage sea igual a 'end' antes de eliminarlo de la matriz de solicitudes; de lo contrario, podría eliminarse prematuramente. – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/294743/">Reimund</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">Esto no funciona si su página web carga el DOM dinámicamente – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">1<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>utilizo una mezcla de los personnal PhantomJS <a href="https://github.com/ariya/phantomjs/blob/master/examples/waitfor.js" rel="nofollow"><code class="prettyprint-override">waitfor.js</code> example</a>.</p> <p>Ésta es mi <code class="prettyprint-override">main.js</code> archivo:</p> <pre><code class="prettyprint-override">'use strict'; var wasSuccessful = phantom.injectJs('./lib/waitFor.js'); var page = require('webpage').create(); page.open('http://foo.com', function(status) { if (status === 'success') { page.includeJs('https://cdnjs.cloudflare.com/ajax/libs/jquery/3.1.1/jquery.min.js', function() { waitFor(function() { return page.evaluate(function() { if ('complete' === document.readyState) { return true; } return false; }); }, function() { var fooText = page.evaluate(function() { return $('#foo').text(); }); phantom.exit(); }); }); } else { console.log('error'); phantom.exit(1); } }); </code></pre> <p>y el archivo <code class="prettyprint-override">lib/waitFor.js</code> (que es sólo una copia y pega de la función <code class="prettyprint-override">waifFor()</code> de los PhantomJS <a href="https://github.com/ariya/phantomjs/blob/master/examples/waitfor.js" rel="nofollow"><code class="prettyprint-override">waitfor.js</code> example</a>):</p> <pre><code class="prettyprint-override">function waitFor(testFx, onReady, timeOutMillis) { var maxtimeOutMillis = timeOutMillis ? timeOutMillis : 3000, //< Default Max Timout is 3s start = new Date().getTime(), condition = false, interval = setInterval(function() { if ((new Date().getTime() - start < maxtimeOutMillis) && !condition) { // If not time-out yet and condition not yet fulfilled condition = (typeof(testFx) === "string" ? eval(testFx) : testFx()); //< defensive code } else { if(!condition) { // If condition still not fulfilled (timeout but condition is 'false') console.log("'waitFor()' timeout"); phantom.exit(1); } else { // Condition fulfilled (timeout and/or condition is 'true') // console.log("'waitFor()' finished in " + (new Date().getTime() - start) + "ms."); typeof(onReady) === "string" ? eval(onReady) : onReady(); //< Do what it's supposed to do once the condi> clearInterval(interval); //< Stop this interval } } }, 250); //< repeat check every 250ms } </code></pre> <p>este método no es asíncrono, pero al menos estoy seguro de que todos los recursos se cargaron antes de intentar usarlos.</p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/40001509">Fuente</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2016-10-12 14:40:59</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/2003537/">Daishi</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">0<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>esta es mi solución, funcionó para mí.</p> <pre><code class="prettyprint-override">page.onConsoleMessage = function(msg, lineNum, sourceId) { if(msg=='hey lets take screenshot') { window.setInterval(function(){ try { var sta= page.evaluateJavaScript("function(){ return jQuery.active;}"); if(sta == 0) { window.setTimeout(function(){ page.render('test.png'); clearInterval(); phantom.exit(); },1000); } } catch(error) { console.log(error); phantom.exit(1); } },1000); } }; page.open(address, function (status) { if (status !== "success") { console.log('Unable to load url'); phantom.exit(); } else { page.setContent(page.content.replace('</body>','<script>window.onload = function(){console.log(\'hey lets take screenshot\');}</script></body>'), address); } }); </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/45237217">Fuente</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2017-07-21 12:04:50</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/8344308/">Tom</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">Cuestiones relacionadas</div> <ul class="relative_list"> <li> 1. <a href="http://es.uwenku.com/question/p-evwzbrmu-bs.html" target="_blank" title="ExtJS esperando la carga de varias tiendas"> ExtJS esperando la carga de varias tiendas </a> </li> <li> 2. <a href="http://es.uwenku.com/question/p-rgecxbpq-bg.html" target="_blank" title="Esperando la carga de la ventana secundaria para completar"> Esperando la carga de la ventana secundaria para completar </a> </li> <li> 3. <a href="http://es.uwenku.com/question/p-pdcuxyet-z.html" target="_blank" title="Ajax.BeginForm devuelve la página completa"> Ajax.BeginForm devuelve la página completa </a> </li> <li> 4. <a href="http://es.uwenku.com/question/p-nblyousb-d.html" target="_blank" title="¿Mi proceso está esperando la entrada?"> ¿Mi proceso está esperando la entrada? </a> </li> <li> 5. <a href="http://es.uwenku.com/question/p-yroculrm-b.html" target="_blank" title="carga no desencadenar ajaxSetup manejador completa en completa"> carga no desencadenar ajaxSetup manejador completa en completa </a> </li> <li> 6. <a href="http://es.uwenku.com/question/p-amvxtznq-bm.html" target="_blank" title="carga de la página() o página init()"> carga de la página() o página init() </a> </li> <li> 7. <a href="http://es.uwenku.com/question/p-vqydgcpt-bp.html" target="_blank" title="¿Por qué la aplicación está esperando el depurador cuando no está conectada a la computadora?"> ¿Por qué la aplicación está esperando el depurador cuando no está conectada a la computadora? </a> </li> <li> 8. <a href="http://es.uwenku.com/question/p-uaayqtkp-e.html" target="_blank" title="Phantomjs no ejecuta la función en la función page.valuate"> Phantomjs no ejecuta la función en la función page.valuate </a> </li> <li> 9. <a href="http://es.uwenku.com/question/p-xhjljlca-r.html" target="_blank" title="jQuery no se carga en la página maestra cuando la página de contenido está en una carpeta secundaria"> jQuery no se carga en la página maestra cuando la página de contenido está en una carpeta secundaria </a> </li> <li> 10. <a href="http://es.uwenku.com/question/p-dqfdddew-bk.html" target="_blank" title="Comportamiento de carga inesperado de PhantomJS con varias páginas"> Comportamiento de carga inesperado de PhantomJS con varias páginas </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://es.uwenku.com/question/p-hkwescjd-e.html" target="_blank" title="Forzar la representación de la página completa en Mobile Safari?"> Forzar la representación de la página completa en Mobile Safari? </a> </li> <li> 12. <a href="http://es.uwenku.com/question/p-zqybhvmq-n.html" target="_blank" title="¿Está completa la hornada de lotes?"> ¿Está completa la hornada de lotes? </a> </li> <li> 13. <a href="http://es.uwenku.com/question/p-mwkppguc-be.html" target="_blank" title="¿Cómo puedo ejecutar una función de JavaScript después de que se completa la carga de página?"> ¿Cómo puedo ejecutar una función de JavaScript después de que se completa la carga de página? </a> </li> <li> 14. <a href="http://es.uwenku.com/question/p-dvehgape-d.html" target="_blank" title="Cordova/Phonegap carga de la página externa página de inicio"> Cordova/Phonegap carga de la página externa página de inicio </a> </li> <li> 15. <a href="http://es.uwenku.com/question/p-kxkemziv-bv.html" target="_blank" title="Guarde y represente una página web con PhantomJS y node.js"> Guarde y represente una página web con PhantomJS y node.js </a> </li> <li> 16. <a href="http://es.uwenku.com/question/p-vcfzqszo-s.html" target="_blank" title="Obtener la URL completa de la página actual (PHP)"> Obtener la URL completa de la página actual (PHP) </a> </li> <li> 17. <a href="http://es.uwenku.com/question/p-opgxhaps-bm.html" target="_blank" title="C++ getline() no está esperando la entrada de la consola cuando se llama varias veces"> C++ getline() no está esperando la entrada de la consola cuando se llama varias veces </a> </li> <li> 18. <a href="http://es.uwenku.com/question/p-wdawmfqd-bs.html" target="_blank" title="Detectar WebBrowser página completa cargando"> Detectar WebBrowser página completa cargando </a> </li> <li> 19. <a href="http://es.uwenku.com/question/p-oybxmovb-t.html" target="_blank" title="iphone uiwebview descarga la página completa con CSS e imágenes"> iphone uiwebview descarga la página completa con CSS e imágenes </a> </li> <li> 20. <a href="http://es.uwenku.com/question/p-bdrtyato-bk.html" target="_blank" title="Activación de validación en la página Carga"> Activación de validación en la página Carga </a> </li> <li> 21. <a href="http://es.uwenku.com/question/p-wpddrnfj-bu.html" target="_blank" title="Enterprise Edition Los eventos del controlador no se activan si la memoria caché de la página completa está habilitada"> Enterprise Edition Los eventos del controlador no se activan si la memoria caché de la página completa está habilitada </a> </li> <li> 22. <a href="http://es.uwenku.com/question/p-xulhjnlz-c.html" target="_blank" title="Iniciar la animación en la carga de la página, detener en la página cargada"> Iniciar la animación en la carga de la página, detener en la página cargada </a> </li> <li> 23. <a href="http://es.uwenku.com/question/p-takhnxps-b.html" target="_blank" title="La función de cambio de tamaño de jQuery no funciona en la carga de la página"> La función de cambio de tamaño de jQuery no funciona en la carga de la página </a> </li> <li> 24. <a href="http://es.uwenku.com/question/p-hgxueofv-t.html" target="_blank" title="ejecutar la función cuando se carga la página"> ejecutar la función cuando se carga la página </a> </li> <li> 25. <a href="http://es.uwenku.com/question/p-reovvkzq-bu.html" target="_blank" title="¿Cómo agregar el control a la página programáticamente en la carga de la página?"> ¿Cómo agregar el control a la página programáticamente en la carga de la página? </a> </li> <li> 26. <a href="http://es.uwenku.com/question/p-srtwllct-bo.html" target="_blank" title="Tomando instantáneas de la página web mientras pruebas unitarias usando phantomjs y jazmín"> Tomando instantáneas de la página web mientras pruebas unitarias usando phantomjs y jazmín </a> </li> <li> 27. <a href="http://es.uwenku.com/question/p-fxkseblx-bs.html" target="_blank" title="HTML5 onpopstate en la página carga"> HTML5 onpopstate en la página carga </a> </li> <li> 28. <a href="http://es.uwenku.com/question/p-xoydvvbc-bx.html" target="_blank" title="cómo interrumpir un hilo que está esperando la función recv?"> cómo interrumpir un hilo que está esperando la función recv? </a> </li> <li> 29. <a href="http://es.uwenku.com/question/p-pltltdrz-bo.html" target="_blank" title="Método para la página HTML de pantalla completa centrada verticalmente?"> Método para la página HTML de pantalla completa centrada verticalmente? </a> </li> <li> 30. <a href="http://es.uwenku.com/question/p-xohksvrn-bk.html" target="_blank" title="¿Detecta la carga de la primera página con jQuery?"> ¿Detecta la carga de la primera página con jQuery? </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048471"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> Última pregunta </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://es.uwenku.com/question/p-bzzimagq-bu.html" target="_blank" title="Diferencia entre Invoke y DynamicInvoke"> Diferencia entre Invoke y DynamicInvoke </a> </li> <li class="side_article_list_item"> 2. <a href="http://es.uwenku.com/question/p-xwidcdgr-bv.html" target="_blank" title="cómo enviar imageview de una actividad a otra"> cómo enviar imageview de una actividad a otra </a> </li> <li class="side_article_list_item"> 3. <a href="http://es.uwenku.com/question/p-yxhtbgzo-bu.html" target="_blank" title="Revertir al Compromiso Previo - Github para MAC (una reversión ya está en progreso)"> Revertir al Compromiso Previo - Github para MAC (una reversión ya está en progreso) </a> </li> <li class="side_article_list_item"> 4. <a href="http://es.uwenku.com/question/p-nfjijhqb-bh.html" target="_blank" title="Cuanto más, mejor para PHP memory_limit?"> Cuanto más, mejor para PHP memory_limit? </a> </li> <li class="side_article_list_item"> 5. <a href="http://es.uwenku.com/question/p-uaswxwpf-ba.html" target="_blank" title="¿Cómo recuperar 'KeyValue' de Telerik RadGrid?"> ¿Cómo recuperar 'KeyValue' de Telerik RadGrid? </a> </li> <li class="side_article_list_item"> 6. <a href="http://es.uwenku.com/question/p-qlcvjqrb-bb.html" target="_blank" title="¿Es posible obtener el iOS 6 advertisingIdentifier en Mobile Safari?"> ¿Es posible obtener el iOS 6 advertisingIdentifier en Mobile Safari? </a> </li> <li class="side_article_list_item"> 7. <a href="http://es.uwenku.com/question/p-qhyffnat-q.html" target="_blank" title="Citas de marcado en octopress"> Citas de marcado en octopress </a> </li> <li class="side_article_list_item"> 8. <a href="http://es.uwenku.com/question/p-upbmycrg-d.html" target="_blank" title="No se puede crear una conexión al origen de datos 'TfsOlapReportDS'"> No se puede crear una conexión al origen de datos 'TfsOlapReportDS' </a> </li> <li class="side_article_list_item"> 9. <a href="http://es.uwenku.com/question/p-bbmwzvkg-bw.html" target="_blank" title="translúcido de diálogo Tema para Holo"> translúcido de diálogo Tema para Holo </a> </li> <li class="side_article_list_item"> 10. <a href="http://es.uwenku.com/question/p-qiftzznm-br.html" target="_blank" title="Publicación de un conjunto de subclases"> Publicación de un conjunto de subclases </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> Cuestiones relacionadas</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://es.uwenku.com/question/p-evwzbrmu-bs.html" target="_blank" title="ExtJS esperando la carga de varias tiendas"> ExtJS esperando la carga de varias tiendas </a> </li> <li class="side_article_list_item"> 2. <a href="http://es.uwenku.com/question/p-rgecxbpq-bg.html" target="_blank" title="Esperando la carga de la ventana secundaria para completar"> Esperando la carga de la ventana secundaria para completar </a> </li> <li class="side_article_list_item"> 3. <a href="http://es.uwenku.com/question/p-pdcuxyet-z.html" target="_blank" title="Ajax.BeginForm devuelve la página completa"> Ajax.BeginForm devuelve la página completa </a> </li> <li class="side_article_list_item"> 4. <a href="http://es.uwenku.com/question/p-nblyousb-d.html" target="_blank" title="¿Mi proceso está esperando la entrada?"> ¿Mi proceso está esperando la entrada? </a> </li> <li class="side_article_list_item"> 5. <a href="http://es.uwenku.com/question/p-yroculrm-b.html" target="_blank" title="carga no desencadenar ajaxSetup manejador completa en completa"> carga no desencadenar ajaxSetup manejador completa en completa </a> </li> <li class="side_article_list_item"> 6. <a href="http://es.uwenku.com/question/p-amvxtznq-bm.html" target="_blank" title="carga de la página() o página init()"> carga de la página() o página init() </a> </li> <li class="side_article_list_item"> 7. <a href="http://es.uwenku.com/question/p-vqydgcpt-bp.html" target="_blank" title="¿Por qué la aplicación está esperando el depurador cuando no está conectada a la computadora?"> ¿Por qué la aplicación está esperando el depurador cuando no está conectada a la computadora? </a> </li> <li class="side_article_list_item"> 8. <a href="http://es.uwenku.com/question/p-uaayqtkp-e.html" target="_blank" title="Phantomjs no ejecuta la función en la función page.valuate"> Phantomjs no ejecuta la función en la función page.valuate </a> </li> <li class="side_article_list_item"> 9. <a href="http://es.uwenku.com/question/p-xhjljlca-r.html" target="_blank" title="jQuery no se carga en la página maestra cuando la página de contenido está en una carpeta secundaria"> jQuery no se carga en la página maestra cuando la página de contenido está en una carpeta secundaria </a> </li> <li class="side_article_list_item"> 10. <a href="http://es.uwenku.com/question/p-dqfdddew-bk.html" target="_blank" title="Comportamiento de carga inesperado de PhantomJS con varias páginas"> Comportamiento de carga inesperado de PhantomJS con varias páginas </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://es.uwenku.com/contact">Contactanos</a></li> <li>© 2020 ES.UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer>  <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>

phantomjs no está esperando la carga de la página "completa"

Respuesta