Estoy intentando buscar algo de HTML de varios blogs y he notado que diferentes proveedores usan la misma etiqueta de diferentes maneras.La mejor manera de obtener una etiqueta HTML variable
Por ejemplo, aquí hay dos principales proveedores que utilizan la etiqueta meta generador de nombres de forma diferente:
- Blogger:
<meta content='blogger' name='generator'/>
(contenido primero, nombre posteriores y, sí, comillas simples!) - WordPress:
<meta name="generator" content="WordPress.com" />
(nombre primero, contenido posterior)
¿Hay alguna manera de extraer el valor del contenido para todos los casos (comillas simples/dobles, primero/último en la fila)?
P.S. Aunque estoy usando Java, la respuesta probablemente ayude a más personas si es para expresiones regulares en general.