Aquí está el mensaje de Twitter que estoy tratando de analizar (como se puede ver, algunas de ellas no son las etiquetas, sólo una parte de las direcciones URL):de expresiones regulares para analizar Hashtags en Java
#anothertag Arrogance and bad PR http://www.adobe.com/index.html#anchor1. John
Nack on &#Adobe: Information about Photoshop© CS3 on Snow Leopard
#fail #design</pre>
Esta expresión regular es lo que tengo hasta ahora, pero todavía recoge algunas de las etiquetas url:
[##]+([A-Za-z0-9-_]+)
Entonces, ¿qué estás tratando de obtener exactamente? ¿Puedes proporcionar el resultado esperado? – serg
Lo siento, debería haber sido más claro. Estoy tratando de hacer una coincidencia para encontrar cuáles son todas las etiquetas en un tweet determinado. Esperaría que el tweet de arriba devolvería 'otro tipo', 'fallar' y 'diseño'. –
¿Has probado este? http://stackoverflow.com/questions/1563844/best-hashtag-regex/5768660#5768660 La regex arcain provee se basa en el código de Twitter y si lo estoy leyendo correctamente, se asegura de que el mensaje no comience con una hashtag. Si desea desactivar eso, puede eliminar el primer grupo entre paréntesis. Debería mencionar que no he probado esta expresión regular personalmente :) – johncip