Deseo obtener la lista de todas las URL de imagen del código fuente HTML de una página web (tanto abul y urls relativas). Usé Jsoup para analizar el HTML pero no está dando todas las imágenes. Por ejemplo, cuando estoy de análisis google.com fuente HTML de su mostrando cero images..In google.com HTML enlaces de imágenes de origen están en forma ..Extraer todas las imágenes de HTML con JAVA
"background:url(/intl/en_com/images/srpr/logo1w.png)
Y en rediff.com las imágenes están en forma de enlaces ..
videoArr[j]=new Array("http://ishare.rediff.com/video/entertainment/bappi-da-the-first-indian-in-grammy-jury/2684982","http://datastore.rediff.com/h86-w116/thumb/5E5669666658606D6A6B6272/v3np2zgbla4vdccf.D.0.bappi.jpg","Bappi Da - the first Indian In Grammy jury","http://mypage.rediff.com/profile/getprofile/LehrenTV/12669275","LehrenTV","(2:33)"); j = 1 videoArr[j]=new Array("http://ishare.rediff.com/video/entertainment/bebo-shahid-jab-they-met-again-/2681664","http://datastore.rediff.com/h86-w116/thumb/5E5669666658606D6A6B6272/ra8p9eeig8zy5qvd.D.0.They-Met-Again.jpg","Bebo-Shahid : Jab they met again!","http://mypage.rediff.com/profile/getprofile/LehrenTV/12669275","LehrenTV","(2:17)");
Todas las imágenes no están con en "img" tags..I también quieren extraer imágenes que no son incluso con etiquetas de "img" como se muestra en la fuente HTML anterior.
¿Cómo puedo hacer esto ..? Por favor, ayúdame en este .. Gracias
¿Por qué Java? ¿Has pensado en desarrollar un complemento de navegador? – fglez
¿O implementar un proxy que guarda las imágenes? –