Supongamos que tengo cuerda, como a continuación:eliminar cualquier cosa dentro de un par de paréntesis utilizando gsub en I
<a>b<c>
Quiero eliminar tanto <a>
y <c>
, pero no puedo utilizar gsub("<.*>","","<a>b<c>")
como se eliminará el b
además.
Hice una pregunta similar antes, pero en un segundo pensamiento, creo que debería aprender en general, cómo lidiar con este tipo de problemas. Gracias.
La solución más general es utilizar un analizador. A menos que pueda estar seguro de que no hay símbolos que se hayan escapado, que cada símbolo coincida, que no se produzca el anidamiento, y muchas otras advertencias, lo mejor es usar un analizador sintáctico. Hay una pregunta bastante famosa sobre SO sobre expresiones regulares y HTML. Aunque no ha mencionado HTML, parece que podría dirigirse a lenguajes de marcado como HTML y XML. – Iterator