2009-07-16 31 views
8

He mirado alrededor, y no parece que haya ningún estándar de qué etiquetas HTML están 'permitidas' en RSS; podría poner cualquier cosa. Pero los lectores que probé solo permiten ciertas cosas.¿Cuáles son las etiquetas HTML válidas en las fuentes RSS?

En mi prueba inicial, parece que las etiquetas de estilo simple como <b> están bien. Lo mismo ocurre con los estilos en línea como < span style = "color: red" > <img> Parece que funciona. Pero <iframe> se ignoran, al igual que los bloques de script < >. Los atributos Onclick no funcionan. <estilo> bloques funcionan en algunos lectores pero no en otros

¿Existe un consenso general, estándar o sitio de compatibilidad que enumere qué es y qué no es compatible con qué lectores? Quiero saber qué es el subconjunto de etiquetas HTMl que puedo usar en los feeds.

+0

¿Acabas de poner las etiquetas tal como están o hay alguna marca especial para ellas? Porque pensé que los lectores de XML malinterpretarían las etiquetas HTML como elementos separados. –

Respuesta

1

No creo que haya un estándar aquí: se trata de lo que el lector de RSS está dispuesto a implementar. Así que supongo que, por ejemplo, Google Reader borraría las etiquetas y los atributos peligrosos de HTML y CSS, y luego permitiría cualquier otro tipo de etiqueta no incluida en la lista negra que se atrevería a incluir.

Así que, sí. No hay especificaciones, y por lo tanto, probablemente no existan estándares, solo las mismas técnicas generales de prevención XSS que vemos en todo el interwebs. Tu única opción es probar varias etiquetas que crees que pueden ser polémicas (aunque realmente esperaría que se permita casi cualquier cosa excepto el estilo CSS) en diferentes lectores de RSS para ver qué sucede, o simplemente para tener tu contenido listo para retroceder. a un formato más básico si no se permite el HTML/CSS deseado.

¿Qué estás tratando de hacer en particular? Es posible que pueda obtener mejores respuestas si puede especificar, ¿o es solo una cuestión de curiosidad?

+0

Mayormente curiosidad. Me encantaría que los usuarios hagan cosas como votar arriba y abajo usando javascript y ajax desde un lector de RSS, pero creo que lo mejor que podré hacer son enlaces externos con tokens únicos. –

+1

Mhm. Si mi lector de RSS permitiera Javascript, bueno, me enojaría. Es difícil ser un desarrollador y un usuario xD – Matchu

0

No creo que haya ninguna respuesta "oficial". Puede depender del nivel de compatibilidad que pretendas.

Lo mantendría en las etiquetas de formato de texto básico (FUERTE, EM, etc.) e IMG y A, y eso es todo.

1

Creo que lo "correcto" es incluir un espacio de nombres xhtml (xmlns: html = "http://www.w3.org/1999/xhtml") o poner los datos HTML en una sección CDATA.

0

De hecho, no se permiten atributos HTML en las fuentes RSS. Solo se permiten las etiquetas XML enumeradas en la especificación publicada anteriormente. Además, dado que es XML, solo se permiten algunas codificaciones Unicode (por ejemplo, UTF-8). Que muchos proveedores de RSS no respeten el estándar es otro asunto.

11
<title>How to parse full html content in xml feeds</title> 
<description><![CDATA[<html><body>Any code html is valid here like &npsb; 
and what ever you want to transfer</body></html>]]></description> 
<guid>http://example.com/your-news-id</guid> 
Cuestiones relacionadas