2009-03-31 8 views

Respuesta

18

Buenas noticias: tienes razón ... no necesitas bajar el RFC822. El parámetro message_parts a fetch() le permite ser bastante refinado.

He aquí un ejemplo sencillo de cómo se ha podido recuperar sólo el encabezado:

import imaplib 
from email.parser import HeaderParser 

conn = imaplib.IMAP4('my.host.com') 
conn.login('[email protected]', 'mypassword') 
conn.select() 
conn.search(None, 'ALL') # returns a nice list of messages... 
         # let's say I pick #1 from this 

data = conn.fetch(1, '(BODY[HEADER])') 

# gloss over data structure of return... I assume you know these 
# gives something like: 
# ('OK', [(1 (BODY[HEADER] {1662', 'Received: etc....')]) 
header_data = data[1][0][1] 

parser = HeaderParser() 
msg = parser.parsestr(header_data) 
<email.message.Message instance at 0x2a> 

print msg.keys() 
['Received', 'Received', 'Received', 'Cc', 'Message-Id', 'From', 'To', 
'In-Reply-To', 'Content-Type', 'Content-Transfer-Encoding', 'Mime-Version', 
'Subject', 'Date', 'References', 'X-Mailer', 
'X-yoursite-MailScanner-Information', 
'X-yoursite-MailScanner', 'X-yoursite-MailScanner-From', 'Return-Path', 
'X-OriginalArrivalTime'] 

La lista completa de las partes del mensaje que se pueden pasar como segundo argumento a fetch está en la especificación IMAP4: http://tools.ietf.org/html/rfc1730#section-6.4.5

+1

En mi caso he tenido que hacer 'header_data = data [0] [1] .decode ('utf-8')'. Espero que esto ayude a alguien. –

+0

@AndreiStalbe Sí, eso es necesario con Python 3, ya que 'IMAP.fetch()' devuelve cadenas de bytes y 'HeaderParser.parsestr()' espera una cadena. –

+0

@AndreiStalbe, oh, vale, acabo de pasar media hora averiguando eso. Debo leer los comentarios en el futuro! Por cierto, 'utf-8' es la codificación predeterminada, por lo que no es necesario especificar eso. – mihai

Cuestiones relacionadas