¿Hay alguna manera de dividir una cadena larga de HTML después de N palabras? Obviamente, podría usar:Dividir HTML después de N palabras en python
' '.join(foo.split(' ')[:n])
para obtener los primeros n palabras de una cadena de texto sin formato, pero que podría dividir en medio de una etiqueta HTML, y no producirá HTML válido porque no cerrará la etiquetas que han sido abiertas
Necesito hacer esto en un sitio zope/plone - si hay algo estándar en los productos que pueden hacerlo, sería ideal.
Por ejemplo, decir que tengo el texto:
<p>This is some text with a
<a href="http://www.example.com/" title="Example link">
bit of linked text in it
</a>.
</p>
y te pido para dividir después de 5 palabras, debe devolver:
<p>This is some text with</p>
7 palabras:
<p>This is some text with a
<a href="http://www.example.com/" title="Example link">
bit
</a>
</p>
¿Desea ignorar las etiquetas para que no se dividan? En otras palabras, solo obtenga y divida el texto que no está contenido en una etiqueta. – monkut
¿Está buscando dividir el texto del documento encapsulado entre etiquetas (por ejemplo, entre las etiquetas
y
)? – gotgenes