Comenzaré describiendo el problema ...
Tenía una cuenta de correo electrónico configurada en Outlook 2010 conectada a un servidor de Exchange. Realicé una copia de seguridad de mis correos electrónicos localmente en un archivo PST. (ahora ya no tengo acceso a la cuenta de Exchange)
A continuación, quería exportar estos correos archivados para usarlos dentro de Thunderbird 10.x (colocarlos en las carpetas locales en TB). El archivo PST tiene un tamaño de alrededor de 500 MB.
Probé diferentes métodos:
- Mi primer intento fue usar la
Import > Mail > Outlook
función directamente desde el interior de TB como se sugiere aquí . - En otro intento, "copié" mis correos electrónicos (arrastrar y soltar) a un tercer correo electrónico IMAP común configurado en Outlook y Thunderbird (que de hecho es un servidor de correo que se ejecuta localmente en la interfaz 127.0.0.1), luego los introduje en mi carpeta local una vez dentro de TB.
- Incluso intenté usar Outlook Express como un paso intermedio (Outlook -> Outlook Express -> Thunderbird).
Todo lo anterior falla, ya que los correos electrónicos no se conservan cuando se exportan. He encontrado varios problemas, por nombrar algunos:
- si tenemos
Content-Type: multipart/alternative;
correos electrónicos con ambos formatos html / text, entonces solo se exporta el html. - A veces se utilizan diferentes codificaciones que las originales (base64, entre comillas, etc.
- la historia de las rutas (
Received:
encabezados) se ha ido por completo - las direcciones a veces se pierden y simplemente se mantiene el nombre para mostrar. ex:
To: "First Last" <nick@server.com>
se transforma en:To: "First Last"
- a veces se pierde toda la dirección del remitente / receptor, y simplemente se duplica desde el campo opuesto
- la zona horaria del campo de fecha se cambia a la zona horaria de la máquina actual (no es un problema)
- todo tipo de otros encabezados se agregan / eliminan / reescriben de manera diferente ...
Entonces, mi pregunta es ¿cómo puedo exportar correos electrónicos desde mi archivo PST al formato de texto EML / MBOX de Thunderbird, de una manera limpia que conserva todos los encabezados originales?
Entiendo que la especificación de los archivos PST ahora está disponible públicamente (¿verdad?), Así que espero que alguien haya desarrollado una herramienta decente para esta tarea. A mi modo de ver, si de alguna manera tuviéramos acceso a los correos electrónicos sin procesar en Outlook ( como view-source en TB), ¡no debería ser difícil simplemente escribirlos en archivos de texto!
Por cierto: en Outlook Express , podríamos elegir File > Save As
y exportar directamente en formato .eml, pero Outlook 2010 solo tiene la opción de formato binario .msg (¿propietario?) (O me falta algo) ...
Aquí hay una muestra para mostrar cómo se destrozan los correos electrónicos: se han cambiado los nombres y otras cosas para proteger a los inocentes :)
Correo electrónico original en Outlook (abra el correo electrónico en una nueva ventana, vaya File > Properties
e inspeccione el campo de texto 'Encabezados de Internet', ¡aunque a veces está en blanco!)
Received: from mail.server (192.168.2.1)
by s2.server (192.168.5.1) with Microsoft SMTP Server id 14.0.702.0;
Thu, 3 Feb 2011 12:51:26 -0500
Received: from mail.server (mail.server [192.168.6.1])
by mail.server (8.14.5.Beta0/8.14.5.Beta0) with ESMTP id p00000000000002;
Thu, 3 Feb 2011 12:51:26 -0500
Received: from smtp.server (smtp.server [192.168.4.1])
by mail.server (8.14.5.Beta0/8.14.5.Beta0) with ESMTP id p00000000000001
for <list@server>; Thu, 3 Feb 2011 12:51:16 -0500
Received: from s3.server (s4.server [192.168.3.1])
by smtp.server (8.14.4/8.14.4) with ESMTP id p0000000000000
for <list@server>; Thu, 3 Feb 2011 12:51:16 -0500 (envelope-from sender@server)
Received: from s1.server ([ffff::0000:000:0000:0000])
by s3.server ([ffff::1111:000:0000:0000%12]) with mapi;
Thu, 3 Feb 2011 12:51:15 -0500
From: sender@server
Subject: test
Thread-Topic: test
Thread-Index: A0000000011112222333344445555g==
Date: Thu, 3 Feb 2011 12:51:15 -0500
Message-ID: <99887766554433221100FFEEDDCCBBAA99887766@s1.server>
Accept-Language: en-US
Content-Language: en-US
X-MS-Has-Attach:
X-MS-TNEF-Correlator:
Content-Type: text/plain; charset="iso-8859-1"
Content-Transfer-Encoding: quoted-printable
MIME-Version: 1.0
To: undisclosed-recipients:;
Return-Path: list-request@server
X-MS-Exchange-Organization-AuthSource: s2.server
X-MS-Exchange-Organization-AuthAs: Anonymous
X-MS-Exchange-Organization-AVStamp-Mailbox: MSFTFF;1;0;0 0 0
X-MS-Exchange-Organization-SCL: -1
Importada de correo electrónico en Thunderbird (simplemente Ctrl+ Ua ver fuente)
From: sender@server
Subject: test
Thread-Index: A9999888877776666555544443333g==
Date: Thu, 3 Feb 2011 12:51:15 -0500
Message-ID: <99887766554433221100FFEEDDCCBBAA99887766@s1.server>
acceptlanguage: en-US
Content-Language: en-us
Content-Type: text/plain; charset="iso-8859-1"
Content-Transfer-Encoding: 7bit
MIME-Version: 1.0
To: sender@server
X-Mailer: Microsoft Outlook 14.0
x-ms-exchange-organization-authsource: s2.server
x-ms-exchange-organization-authas: Anonymous
X-OlkEid: 00112233445566778899AABBCCDDEEFF00112233