¿Existe una biblioteca Java existente que proporcione un método para quitar todas las etiquetas HTML de una cadena? Estoy buscando algo equivalente a la función strip_tags
en PHP.Eliminación de etiquetas HTML en Java
Sé que puedo usar una expresión regular como se describe en this Stackoverflow question, sin embargo, estaba ansioso por ver si puede haber ya un método stripTags()
flotando en algún lugar en la biblioteca de Apache Commons que se puede utilizar.
Mientras tanto estoy usando el siguiente código para quitar todas las etiquetas HTML de la cadena: cadena strippedHtml = rawHtml.replaceAll ("<(.|\n)*?>", ""); – Todd