Necesito rozar una página web usando Java y he leído que la expresión regular es una forma bastante ineficiente de hacerlo y uno debe ponerla en un documento DOM para navegarla.Algo de ayuda raspando una página en Java
He intentado leer la documentación, pero parece demasiado extensa y no sé por dónde empezar.
¿Podría mostrarme cómo raspar la tabla this en una matriz? Puedo intentar averiguar mi camino desde allí. Un fragmento/ejemplo también serviría.
Gracias.
He echado un vistazo a los documentos jSoup y parece bastante bueno. ¡Estaba buscando algo en las líneas de BeautifulSoup para Python y aquí está! –