Buenas noticias: tienes razón ... no necesitas bajar el RFC822. El parámetro message_parts
a fetch()
le permite ser bastante refinado.
He aquí un ejemplo sencillo de cómo se ha podido recuperar sólo el encabezado:
import imaplib
from email.parser import HeaderParser
conn = imaplib.IMAP4('my.host.com')
conn.login('[email protected]', 'mypassword')
conn.select()
conn.search(None, 'ALL') # returns a nice list of messages...
# let's say I pick #1 from this
data = conn.fetch(1, '(BODY[HEADER])')
# gloss over data structure of return... I assume you know these
# gives something like:
# ('OK', [(1 (BODY[HEADER] {1662', 'Received: etc....')])
header_data = data[1][0][1]
parser = HeaderParser()
msg = parser.parsestr(header_data)
<email.message.Message instance at 0x2a>
print msg.keys()
['Received', 'Received', 'Received', 'Cc', 'Message-Id', 'From', 'To',
'In-Reply-To', 'Content-Type', 'Content-Transfer-Encoding', 'Mime-Version',
'Subject', 'Date', 'References', 'X-Mailer',
'X-yoursite-MailScanner-Information',
'X-yoursite-MailScanner', 'X-yoursite-MailScanner-From', 'Return-Path',
'X-OriginalArrivalTime']
La lista completa de las partes del mensaje que se pueden pasar como segundo argumento a fetch
está en la especificación IMAP4: http://tools.ietf.org/html/rfc1730#section-6.4.5
En mi caso he tenido que hacer 'header_data = data [0] [1] .decode ('utf-8')'. Espero que esto ayude a alguien. –
@AndreiStalbe Sí, eso es necesario con Python 3, ya que 'IMAP.fetch()' devuelve cadenas de bytes y 'HeaderParser.parsestr()' espera una cadena. –
@AndreiStalbe, oh, vale, acabo de pasar media hora averiguando eso. Debo leer los comentarios en el futuro! Por cierto, 'utf-8' es la codificación predeterminada, por lo que no es necesario especificar eso. – mihai