2009-10-06 40 views
8

¿Alguien sabe de un buen analizador de fuentes para Python 3.1? Estaba usando feedparser para 2.5 pero parece que todavía no está portado a 3.1, y aparentemente es más complicado que solo ejecutar 2to3.py en él. ¿Alguna ayuda?Analizador de Python 3.1 RSS?

Respuesta

4

Puede echar un vistazo a la publicación del blog Atom Models de Ian Bicking. Propone no utilizar ninguna biblioteca especial de "análisis de fuentes" porque Atom y RSS son solo XML, por lo que su modelo es realmente un árbol XML, no una clase elegante. Puede probar his code en Python 3.

+3

En estos días, cada vez que alguien dice "solo XML", por lo general Sospechamos que están haciendo una broma. Este enfoque funcionaría bien si está obteniendo feeds producidos por una sola parte de una manera muy consistente. Pero si realmente hay algún elemento humano, no va a funcionar. Los feeds son notoriamente malos cuando se trata de no seguir los estándares, o incluso ser un XML válido. A veces, alguien te entrega el URI de una página HTML en lugar de un feed. Manejar toda esa porquería con gracia es algo de lo que querrás que se ocupe una biblioteca como 'feedparser'. –

+0

Sí, conozco las características de 'feedparser'. Fue solo otra opinión sobre el tema. –

+0

¡Lo intentaré, gracias! – matthew

0

Inicie la transferencia de feedparser a Python 3.1.

+0

jeje, lo intenté. Falló miserablemente. Soy más un "pirata informático" de pitón que un programador. – matthew

1

He estado trabajando en la conversión de feedparser a Python 3, y he publicado a feedparser/Python 3 development branch en GitHub con los resultados de ese trabajo hasta el momento.

También hay un informe de error abierto sobre portar el creador de parches a Python 3, pero dado que soy un nuevo usuario en StackOverflow, actualmente estoy limitado a un solo enlace. Encontrarás el enlace al informe de errores en la parte superior de la página de GitHub (enlaces a code.google.com).