Estoy buscando un analizador sintáctico que me permita analizar con éxito el xml roto, tomando un enfoque de "mejor estimación", por ejemplo.¿Existe un analizador XML laxo y permisivo para PHP?
<thingy>
<description>
something <b>with</b> bogus<br>
markup not wrapped in CDATA
</description>
</thingy>
Lo ideal es que produzca un objeto extraño, con una propiedad de descripción y cualquier etiqueta de sopa dentro.
Otras sugerencias sobre cómo atacar el problema (aparte de tener un marcado válido para empezar) bienvenido.
soluciones no son PHP (Beautiful Soup (Python), por ejemplo) no están fuera de los límites, pero preferiría que se adhieren a la prevaleciente conjunto de habilidades en la empresa
Gracias!
no es XML si es poco estricto ;-) –
No tiene sentido el XML: la idea principal de XML es que lo matará a usted, su familia, sus amigos y cualquier persona con la que haya hablado, si se encuentra con un error de sintaxis. El XML sin manejo de errores draconianos ya no es XML ^^ – NikiC
@nikic - He estado en la misma posición que el OP de tener que lidiar con la entrada "XML" interrumpida proporcionada por un tercero que no entendió el punto de XML. Aunque estoy de acuerdo en que no es ideal, cuando los datos deben ser importados y no podemos lograr que el tercero arregle sus sistemas, solo tenemos que lidiar con eso. :-( – Spudley