Quería hacer un rastreador web basado en Java para un experimento. Escuché que crear un Web Crawler en Java era el camino a seguir si es la primera vez. Sin embargo, tengo dos preguntas importantes.Java Web Crawler Libraries
¿Cómo mi programa 'visitará' o 'conectará' a las páginas web? Por favor, da una breve explicación. (Entiendo los conceptos básicos de las capas de abstracción desde el hardware hasta el software, aquí estoy interesado en las abstracciones de Java)
¿Qué bibliotecas debo usar? Asumiría que necesito una biblioteca para conectarme a páginas web, una biblioteca para el protocolo HTTP/HTTPS y una biblioteca para analizar HTML.
Entonces, ¿esto extraer información de una página, o simplemente ir a la página? Estoy intentando escribir un rastreador que tomará la información del usuario, vaya a maps.google.com, inserte la dirección y tome el tiempo de ruta y la longitud de la ruta y tráigala al programa. es posible? – Ungeheuer
@Adrian eche un vistazo a la API de Google Maps: https://developers.google.com/maps/documentation/distance-matrix/start –