Estoy tratando de recuperar URL base usando java. He usado el analizador jtidy en mi código para recuperar el título. Estoy obteniendo el título correctamente usando jtidy, pero no obtengo la url base de la URL dada.cómo recuperar url base de la url dada usando java
Tengo algunas URL como entrada:
String s1 = "http://staff.unak.is/andy/GameProgramming0910/new_page_2.htm";
String s2 = "http://www.complex.com/pop-culture/2011/04/10-hottest-women-in-fast-and-furious-movies";
A partir de la primera cadena, quiero a buscar "http://staff.unak.is/andy/GameProgramming0910/"
como una dirección URL base y de la segunda cadena, quiero "http://www.complex.com/"
como una dirección URL base.
estoy usando código:
URL url = new URL(s1);
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
InputStream in = conn.getInputStream();
Document doc = new Tidy().parseDOM(in, null);
String titleText = doc.getElementsByTagName("title").item(0).getFirstChild()
.getNodeValue();
estoy recibiendo titletext
, pero por favor, puedo hacerme saber cómo llegar URL base desde arriba dada URL?
¿Qué reglas se dirá que 'http: // www.complex.com/'es la URL base y no' http: // www.complex.com/pop-culture/2011/04/'? –