Tengo un sitio donde los usuarios pueden publicar cosas (como en foros, comentarios, etc.) utilizando una implementación personalizada de TinyMCE. A muchos de ellos les gusta copiar & pegar de Word, lo que significa que su entrada a menudo viene con una plétora de formatos MS en línea asociados.PHP para limpiar pegar entrada de Microsoft
No puedo deshacerme de <span whatever>
ya que TinyMCE depende de la etiqueta span para algunos de sus formatos, y no puedo (y no quiero) forzar a dichos usuarios a usar TinyMCE's "Paste From Word" característica (que no parece funcionar tan bien de todos modos).
¿Alguien sabe de una biblioteca/clase/función que se encargaría de esto por mí? Debe ser un problema común, aunque no puedo encontrar nada definitivo. He estado pensando recientemente que una serie de expresiones regulares de fuerza bruta que buscan patrones específicos de MS podría ser el truco, pero no quiero volver a escribir algo que ya esté disponible a menos que deba hacerlo.
Además, la fijación de comillas, em-guiones, etc. sería buena. Tengo mis propias cosas para hacer esto ahora, pero realmente me gustaría encontrar un filtro de conversión de MS para gobernarlas todas.
Gracias, pero ninguno de estos parece hacer frente al formato de MS, que es lo que más me interesa. HTML Purifier lo tiene planeado para la versión 3.5 pero con "investigación necesaria". – da5id
Entonces te sugiero que cambies a fckeditor, que puede tratar con la entrada de palabras. Actualizado mi respuesta. –
Hmm. Prefiero TinyMCE sobre FCKeditor por varias otras razones, pero esto puede influenciarme. Gracias por la sugerencia y estoy contento de aceptar mi +1 :) – da5id