Quiero buscar ©
en un documento HTML, y básicamente obtener la entidad a la que se atribuye el derecho de autor.seleccionar elemento de texto HTML con expresiones regulares?
La línea de autor muestra un par de maneras diferentes:
<p class="bg-copy">© 2011 The New York Times Company</p>
o
<a href="http://www.nytimes.com/ref/membercenter/help/copyright.html">
© 2011</a>
<a href="http://www.nytco.com/">The New York Times Company</a>
o
<br>Published since 1996<br>Copyright © CounterPunch<br>
All rights reserved.<br>
Quiero hacer caso omiso de las fechas y las etiquetas que intervienen y acaba de obtener "The New York Times Company" o "Counterpunch".
No he podido encontrar mucho sobre el uso de regex con JavaScript o JQuery, aunque me da la impresión de que puede ocasionar grandes dolores de cabeza. Si hay un mejor enfoque para esto, házmelo saber.
No utilice expresiones regulares, en lugar utilizar el árbol DOM para encontrar lo que busca. Algunos enlaces: http://www.howtocreate.co.uk/tutorials/javascript/dombasics – FailedDev
Normalmente, la respuesta que obtendrías es, por favor, no uses regex para el análisis de JS. Usa el analizador JS. La pregunta es, ¿puedes? – ZenMaster
@FailedDev casi lo hizo ... – ZenMaster