2009-04-17 18 views
56

Si es posible, ¿debería aceptar esos correos electrónicos de los usuarios y qué problemas puedo esperar cuando enviaré correos a tales direcciones?¿Puede una dirección de correo electrónico contener caracteres internacionales (no ingleses)?

+4

Es triste que esta pregunta se hizo de nuevo [unos 8 meses más tarde] (http://stackoverflow.com/ questions/2049502/what-characters-are-allowed-in-email-address), y la nueva pregunta tiene muchos más votos, pero TODA la información allí es más obsoleta que la información aquí. Ojalá pudiera dar todas las respuestas aquí +5 o algo así. –

Respuesta

37

Oficialmente, por RFC 6532 - .

Para una explicación rápida, consulte wikipedia sobre el tema.

+0

Además, consulte [RFC 6531: extensión SMTP para correo electrónico internacionalizado] (http://tools.ietf.org/html/rfc6531) además de [RFC 5335: encabezados de correo electrónico internacionalizados] (http://tools.ietf.org/html/rfc5335) y también [¿Son válidos caracteres internacionales (por ejemplo, caracteres umlaut) en la parte local de las direcciones de correo electrónico?] (http://stackoverflow.com/questions/15121359/are-international-characters-eg-umlaut-characters -valid-in-the-local-part-of) –

+1

Mejor aún compruebe [RFC 6532] (https://tools.ietf.org/html/rfc6532) y más detalles [aquí] (http://stackoverflow.com/a/31066998/2350426). –

+1

Definitivamente vea el comentario de @BinaryZebra más abajo en este hilo. RFC-5335 ahora está obsoleto. Su sucesor, RFC-6532, es el estándar actual (ya no es experimental). – Nate

1

Todavía no. El IEEE planea hacer esto: H-Online article: IEFT planning internationalised email addresses, aquí está el RfC: SMTP Extension for Internationalized Email Addresses

Presupuesto de H-Online (como lo fue abajo):

la Internet Engineering Task Force (IETF) ha publicado tres documentos cruciales para la estandarización de los encabezados de las direcciones de correo electrónico que incluyen símbolos fuera del juego de caracteres ASCII. Esto significa que pronto podrá usar caracteres chinos, acentos franceses y diéresis alemanas en las direcciones de correo electrónico, así como solo en el cuerpo del mensaje . Entonces, si su nombre es Zoë y trabaja para una empresa que fabrica fachadas , podría estar interesado en una nueva dirección de correo electrónico. Pero representantes de proveedores ya están gimiendo. Dicen que habría necesidad de ser un "manía de actualización" si el estándar Unicode UTF-8 es reemplazar el Código Estándar Americano para el Intercambio de Información (ASCII) actualmente utilizado como el idioma general del correo electrónico.

RFC 5335 especifica el uso de UTF-8 en prácticamente todos los encabezados de correo electrónico. Deben realizarse cambios en clientes SMTP, servidores SMTP, agentes de correo (MUA), software para listas de correo, puertas de enlace a otros medios, y en cualquier otro lugar donde se procese o transfiera el correo electrónico. RFC 5336 amplía el protocolo de transporte de correo electrónico SMTP. En el nivel del protocolo , la expansión se denomina UTF8SMTP.

Un nuevo campo de cabecera se añadirá como una especie de "paracaídas de emergencia" para asegurar que los UTF-8 correos electrónicos tienen un aterrizaje suave si se tiran por antes de llegar al receptor mediante sistemas que no han sido actualizados. "OldAddress" es una dirección puramente ASCII. Pero OldAddress no está en se utilizará como un canal para un segundo intento de transferencia, sino más bien para hacer que asegure que los comentarios se envíen a su casa.

Finalmente, RFC5337 asegura que se envían los mensajes correctos correspondientes al el estado de entrega de los correos electrónicos no ASCII. Se debe devolver la dirección correcta de un destinatario inalcanzable , incluso si se ha denegado el transporte adicional . La dirección de correo electrónico internacionalización (EAI) que trabaja en el grupo también está trabajando en una serie de "mecanismos de bajada" para varios campos de encabezado y el sobre. Si es posible, la información original del encabezado se debe "empaquetar" y conservar.

DeNIC de Alemania, el registrador para el dominio ".de", no obstante es teniendo esto en su zancada. "Realmente no hay mucho que podamos hacer", explicó el portavoz de DeNIC Klaus Herzig, .DeNIC en su lugar está pagando más atención a la actualización que el IETF está trabajando para el estándar de dominios internacionales - RFC3490, o IDNA2003 ya que es veces conocido. "No estamos muy contentos porque no hay compatibilidad con versiones anteriores ", explicó Herzig. Cuando llega la actualización, DeNIC dice que arrojará su peso detrás del símbolo "ß", también conocido como estzett, , que se ha pasado por alto hasta ahora. El registrador alemán también dice que puede esperar un poco antes de cambiar en luz de la falta de compatibilidad hacia atrás. Una vez que el nuevo estándar sea funcionando establemente y los registradores y proveedores lo hayan adoptado, se agregará el ß .

En contraste, los expertos creen que los registradores chinos en China y Taiwán implementarán rápidamente el cambio para el correo electrónico internacionalizado. Representantes de CNIC y TWNIC son autores de los estándares. Los usuarios chinos actualmente tienen que escribir correos electrónicos en ASCII a la izquierda de @ y en caracteres chinos a la derecha para los dominios chinos , que ya se han internacionalizado.

(Monika Ermert)

+1

Este enlace está muerto ahora cuando se apaga "The H"? –

5

yo supongo que sí ya que un número de dominios de nivel superior permiten ya no ASCII caracteres de dominios y puesto que el dominio es parte de una dirección de correo electrónico, es perfectamente posible. Un ejemplo de tal dominio se www.öko.de

1

respuesta corta: sí

no sólo en el nombre de usuario, sino también en el nombre de dominio se admiten.

+0

¿Sabe qué intercambiador de correo/dominios ya permiten diéresis en la parte local de la dirección de correo electrónico? – nanosoft

8

El problema es que algunos clientes de correo (herramientas de servidor y/o herramientas de escritorio) no lo admiten y lanzan una excepción de 'correo no válido' cuando intenta enviar un correo a una dirección que contiene diéresis, por ejemplo.

Si desea soporte total, puede hacer el truco con la conversión de las partes de la dirección de correo electrónico a "código puny". Esto permite a los usuarios escribir sus direcciones de la manera habitual, pero lo guarda a la manera de nivel admitido.

Ejemplo: müller.com »xn--mller-kva.com

dos puntos a la misma cosa.

0

La respuesta es sí, pero deben codificarse especialmente.

Look at this. Lea la parte que se refiere al correo electrónico-encabezados y RFC 2047.

+0

¿Sabe qué intercambiador de correo/dominios ya permiten diéresis en la parte local de la dirección de correo electrónico? – nanosoft

13

Actualización 2015: Uso RFC 6532

El 5335 experimental está obsoleto en: 6532 y
esta tarde se ha establecido en "Categoría: Normas pista" ,
haciendo es el estándar.

Los Section 3.2 (Extensiones sintaxis para RFC 5322) ha actualizado la mayoría de los campos de texto para incluir
(adecuado) UTF-8.

The following rules extend the ABNF syntax defined in [RFC5322] and 
[RFC5234] in order to allow UTF-8 content. 

VCHAR =/ UTF8-non-ascii 
ctext =/ UTF8-non-ascii 
atext =/ UTF8-non-ascii 
qtext =/ UTF8-non-ascii 
text =/ UTF8-non-ascii 
      ; note that this upgrades the body to UTF-8 
dtext =/ UTF8-non-ascii 

The preceding changes mean that the following constructs now 
allow UTF-8: 
    1. Unstructured text, used in header fields like 
     "Subject:" or "Content-description:". 
    2. Any construct that uses atoms, including but not limited 
     to the local parts of addresses and Message-IDs. This 
     includes addresses in the "for" clauses of "Received:" 
     header fields. 
    3. Quoted strings. 
    4. Domains. 

Note that header field names are not on this list; these are still 
restricted to ASCII. 

Tenga en cuenta la explícita inclusión de Dominios.
Y la exclusión explícita del encabezado nombres.

También Aviso sobre NFKC:

The UTF-8 NFKC normalization form SHOULD NOT be used because 
it may lose information that is needed to correctly spell 
some names in some unusual circumstances. 

Y Section 3 inicio:

Also note that messages in this format require the use of the 
SMTPUTF8 extension [RFC6531] to be transferred via SMTP. 
Cuestiones relacionadas