Respuesta corta
Es imposible garantizar un largo período de tiempo debido a la entropía (¡también llamada muerte!). Los datos digitales decaen y mueren, como cualquier otra cosa en el universo. Pero se puede ralentizar.
Actualmente no hay una manera a prueba de fallas y científicamente probada para garantizar más de 30 años de archivado de datos en frío. Algunos proyectos apuntan a hacer eso, como el Proyecto Rosetta Disks del museo Long Now. , aunque siguen siendo muy costosos y con una baja densidad de datos (unos 50 MB).
Mientras tanto, puede utilizar medios ópticos resistentes científicamente probados para almacenamiento en frío como discos Blu-ray tipo HTL como Panasonic, o DVD + R de archivo como Verbatim Gold Archival, y mantenerlos en cajas herméticas en un lugar suave (evite Temperatura alta) y fuera de la luz.
también ser REDUNDANTE : Realice varias copias de sus datos (al menos 4), y haga cálculos de hashes para verificar con regularidad que todo está bien, y cada pocos años debe volver a escribir sus datos en nuevos discos. Además, usa mucho códigos de corrección de errores , te permitirán reparar tus datos corruptos!
Respuesta larga
¿Por qué los datos se corrompen con el tiempo? La respuesta está en una palabra: entropía . Esta es una de las fuerzas primarias e inevitables del universo, lo que hace que los sistemas se vuelvan cada vez menos ordenados en el tiempo. Corrupción de datos Es exactamente eso: un desorden en bits orden. Así que en otras palabras, El Universo odia tus datos. .
Luchar contra la entropía es exactamente como luchar contra la muerte: es probable que nunca tengas éxito. Pero, puedes encontrar formas de retardar la muerte, al igual que puedes retardar la entropía. También puede engañar a la entropía reparando las corrupciones (en otras palabras: no puede detener las corrupciones, pero puede reparar después de que ocurran si tomó medidas de antemano). Al igual que cualquier cosa sobre la vida y la muerte, no hay una solución mágica, ni una solución para todos, y las mejores soluciones requieren que se involucre directamente en el curación digital de sus datos. E incluso si lo hace todo correctamente, no se garantiza que mantenga sus datos seguros, solo maximiza sus posibilidades.
Ahora las buenas noticias: ahora hay formas bastante eficientes de mantener sus datos, si combinar buena calidad medios de almacenamiento , y bueno estrategias de archivo / curación : debieras diseño para el fracaso .
¿Cuáles son las buenas estrategias de curación? Aclaremos una cosa: la mayor parte de la información que encontrará será sobre las copias de seguridad, no sobre el archivo. El problema es que la mayoría de la gente transferirá sus conocimientos sobre estrategias de copia de seguridad al archivo, por lo que ahora se escuchan muchos mitos. De hecho, almacenar datos durante unos pocos años (copia de seguridad) y almacenar datos durante el mayor tiempo posible durante al menos décadas (archivar) son objetivos totalmente diferentes y, por lo tanto, requieren herramientas y estrategias diferentes.
Afortunadamente, hay mucha investigación y resultados científicos, por lo que aconsejo referirme a esos artículos científicos en lugar de foros o revistas. Aquí resumiré algunas de mis lecturas.
Además, ten cuidado con los reclamos y dependiente estudios científicos, afirmando que tal o cual medio de almacenamiento es perfecto. Recuerda el famoso proyecto Domesday de la BBC: «El libro digital de Domesday dura 15 años, no 1000» . Siempre verifique dos veces los estudios con documentos realmente independientes, y si no hay ninguno, siempre asuma que el medio de almacenamiento no es bueno para archivar.
Aclaremos lo que está buscando (de su pregunta):
Archivo a largo plazo : desea conservar copias de sus datos "personales" sensibles e irreproducibles. Archivando es fundamentalmente diferente a una apoyo , como bien explicado aquí : las copias de seguridad son para datos técnicos dinámicos que se actualizan regularmente y, por lo tanto, deben actualizarse en copias de seguridad (es decir, sistema operativo, diseño de carpetas de trabajo, etc.), mientras que los archivos de respaldo estático datos que probablemente escribe solo una vez Y solo leer desde tiempo al tiempo . Los archivos son para datos intemporales. , usualmente personal.
Almacenamiento en frio : desea evitar el mantenimiento de sus datos archivados tanto como sea posible. Esta es una restricción GRANDE, ya que significa que el medio debe usar componentes y una metodología de escritura que permanezca estable durante mucho tiempo, sin ninguna manipulación de su parte y sin requerir ninguna conexión a una computadora o suministro eléctrico.
Para facilitar nuestro análisis, primero estudiemos las soluciones de almacenamiento en frío y luego las estrategias de archivo a largo plazo.
Medios de almacenamiento en frío
Definimos anteriormente lo que debería ser un buen medio de almacenamiento en frío: debería conservar los datos durante mucho tiempo sin que se requiera ninguna manipulación (por eso se llama "frío": puede almacenarlo en un armario y no necesita enchufarlo una computadora para mantener los datos).
Papel Puede parecer el medio de almacenamiento más resistente de la tierra, porque a menudo encontramos manuscritos muy antiguos de la antigüedad. Sin embargo, el papel tiene grandes inconvenientes: primero, la densidad de datos es muy baja (no puede almacenar más de ~ 100 KB en un papel, incluso con caracteres pequeños y herramientas de computadora), y se degrada con el tiempo sin ninguna forma de monitorearlo , al igual que los discos duros, sufren de corrupción silenciosa. Pero mientras que puedes monitorear corrupciones silenciosas en datos digitales, no puedes en papel. Por ejemplo, no puede garantizar que una imagen retendrá los mismos colores durante solo una década: los colores se degradarán y no tiene forma de encontrar cuáles fueron los colores originales. Por supuesto que puede cura sus imágenes si usted es un profesional en la restauración de imágenes, pero esto requiere mucho tiempo, mientras que con los datos digitales, puede automatizar este proceso de curación y restauración.
Discos Duros (HDDs) son conocido a tener un promedio de vida útil de 3 a 8 años: no solo se degradan con el tiempo, sino que son garantizado para morir eventualmente (es decir, inaccesible). Las siguientes curvas muestran esta tendencia a que todas las unidades de disco duro mueran a una velocidad asombrosa:
Curva de la bañera mostrando la evolución de la tasa de fallas de HDD dado el tipo de error (también aplicable a cualquier dispositivo diseñado):
Curva que muestra la tasa de fallos del disco duro, todos los tipos de error combinados:
Fuente: Backblaze
Se puede ver que hay 3 tipos de HDD en relación con su falla: las que se están muriendo rápidamente (p. Ej., Error de fabricación, HDD de mala calidad, falla de la cabeza, etc.), las de tasa de muerte constante (buena manufactura, mueren por varios " razones "normales", este es el caso de la mayoría de las unidades de disco duro) y, finalmente, las robustas que viven un poco más que la mayoría de las unidades de disco duro y finalmente mueren poco después de las "unidades normales" (por ejemplo: unidades de disco duro con suerte, no muy usadas, Condiciones ambientales ideales, etc.). Por lo tanto, está garantizado que su HDD morirá.
¿Por qué los HDD mueren tan a menudo? Quiero decir, los datos se escriben en un disco magnético, y el campo magnético puede durar décadas antes de desaparecer. La razón por la que mueren es porque la medio de almacenamiento (disco magnético) y la hardware de lectura (tarjeta electrónica + cabezal giratorio) son acoplado : no pueden disociarse, simplemente no puede extraer el disco magnético y leerlo con otra cabeza, porque primero la placa electrónica (que convierte los datos físicos en digitales) es diferente para casi cada HDD (incluso de la misma marca y referencia) , depende de la fábrica de origen), y el mecanismo interno con el cabezal giratorio es tan intrincado que hoy en día es imposible para un humano colocar perfectamente un cabezal giratorio en los discos magnéticos sin matarlos.
Además, los discos duros son conocidos por desimantar con el tiempo si no se utiliza (incluyendo SSD). Por lo tanto, no puede simplemente almacenar datos en un disco duro, almacenarlos en un armario y pensar que retendrá datos sin ninguna conexión eléctrica: necesita conectar su HDD a una fuente eléctrica al menos una vez al año o por parejas de años . Por lo tanto, los discos duros claramente no son un buen ajuste para el almacenamiento en frío.
Cintas magneticas : a menudo se describen como las necesidades de copias de seguridad de acceso y, por extensión, para el archivo. El problema con las cintas magnéticas es que son MUY sensibles: las partículas de óxido magnético se pueden deteriorar fácilmente con el sol, el agua, el aire, los arañazos, desmagnetizarse con el tiempo o cualquier dispositivo electromagnético o simplemente caerse con el tiempo, o impresión a través . Es por eso que usualmente son utilizados solo en centros de datos por profesionales. Además, nunca se ha demostrado que puedan retener datos durante más de una década. Entonces, ¿por qué a menudo se les aconseja hacer copias de seguridad? Debido a que solían ser baratos: en el pasado, costaba de 10 a 100 veces más barato usar cintas magnéticas que los discos duros, y los discos duros solían ser mucho menos estables que ahora. Así que las cintas magnéticas se recomiendan principalmente para copias de seguridad debido a rentabilidad , no por la resistencia, que es lo que más nos interesa cuando se trata de archivar datos.
Tarjetas CompactFlash y Secure Digital (SD) Se sabe que son bastante resistentes y robustos, capaz de sobrevivir a condiciones catastróficas .
Las tarjetas de memoria en la mayoría de las cámaras son prácticamente indestructibles, según la revista Digital Camera Shopper. Cinco formatos de tarjeta de memoria sobrevivieron al ser hervidos, pisoteados, lavados y sumergidos en café o cola.
Sin embargo, como cualquier otro medio magnético, se basa en un campo eléctrico para retener los datos y, por lo tanto, si la tarjeta se agota, los datos pueden perderse totalmente. Por lo tanto, no es un ajuste perfecto para almacenamiento en frío (ya que de vez en cuando necesita volver a escribir todos los datos en la tarjeta para actualizar el campo eléctrico), pero puede ser un buen medio para copias de seguridad y archivos a corto o mediano plazo.
Medios ópticos: Los medios ópticos son una clase de medios de almacenamiento que dependen del láser para leer los datos, como CD, DVD o Blu-ray (BD). Esto puede verse como una evolución del papel, pero escribimos los datos en un tamaño tan pequeño, que necesitábamos un material más preciso y resistente que el papel, y los discos ópticos son solo eso. Las dos ventajas más grandes de los medios ópticos es que el medio de almacenamiento está desacoplado del hardware de lectura (es decir, si su lector de DVD falla, siempre puede comprar otro para leer su disco) y está basado en láser, lo que lo hace universal y prueba futura (es decir, siempre que sepa cómo hacer un láser, siempre puede modificarlo para que lea los bits de un disco óptico mediante emulación, al igual que CAMILEON lo hizo para el proyecto Domesday BBC. ).
Al igual que con cualquier otra tecnología, las nuevas iteraciones no solo ofrecen mayor densidad (espacio de almacenamiento), sino también una mejor corrección de errores y una mejor resistencia frente a la descomposición del medio ambiente (no siempre, pero en general son ciertas). El primer debate sobre la confiabilidad del DVD fue entre DVD-R y DVD + R, e incluso si el DVD-R todavía es común en la actualidad, se reconoce que el DVD + R es más confiable y preciso .
Ahora hay discos DVD de calidad de archivo, específicamente diseñados para almacenamiento en frío, que afirman que pueden soportar un mínimo de ~ 20 años sin ningún tipo de mantenimiento:
El DVD-R de Verbatim Gold Archival [...] ha sido calificado como el DVD-R más confiable en una exhaustiva prueba de resistencia a largo plazo por la prestigiosa revista alemana c't (c't 16/2008, páginas 116-123 ) [...] logrando una durabilidad mínima de 18 años y una durabilidad promedio de 32 a 127 años (a 25ºC, 50% de humedad). Ningún otro disco se acercó a estos valores, el segundo mejor DVD-R tuvo una duración mínima de solo 5 años.
Desde www.linuxtech.net .
Además, algunas empresas especializadas en muy Los archivos de DVD a largo plazo y los comercializan ampliamente, como el M-Disc de Millenniata o el DataTresorDisc, alegando que pueden retener datos durante más de 1000 años, y verificados por algunos (dependiente) estudios (desde 2009) entre otros menos científicos .
¡Todo esto parece muy prometedor! Desafortunadamente, no hay suficientes estudios científicos independientes para confirmar estas afirmaciones, y los pocos disponibles no son tan entusiastas:
La humedad (80% RH) y la temperatura (80 ° C) aceleraron el envejecimiento en varios DVD a lo largo de 2000 horas (aproximadamente 83 días) de la prueba con un control regular de la legibilidad de los datos:
Traducido de la institución francesa para el archivo de datos digitales (Archives de France), estudio de 2012.
El primer gráfico muestra un DVD con una lenta evolución de la degradación. El segundo DVD con curvas de degradación rápida. Y el tercero es para DVD especiales de "muy largo plazo" como M-Disc y DataTresorDisc. Como podemos ver, su rendimiento no se ajusta a los reclamos, ¡es inferior o está a la par con los DVD estándar, sin grado de archivo!
Sin embargo, los discos ópticos inorgánicos como M-Disc y DataTresorDisc tienen una ventaja: son bastante insensibles a la degradación de la luz:
Envejecimiento acelerado con luz (750 W / m²) durante 240 horas:
Estos son excelentes resultados, pero un DVD de calidad de archivo como el Verbatim Gold Archival también logra el mismo rendimiento y, además, la luz es el parámetro más controlable para un objeto: es bastante fácil de poner un DVD en una caja cerrada o en un armario, y por lo tanto Eliminando cualquier posible impacto de la luz de cualquier tipo. Sería mucho más útil obtener un DVD que sea muy resistente a la temperatura y la humedad que la luz.
Este mismo equipo de investigación también estudió el mercado de Blu-ray para ver si habría alguna marca con un buen medio para el almacenamiento en frío a largo plazo. Aquí está su hallazgo:
La humedad y la temperatura aceleraron el envejecimiento en varias marcas de Blu-ray, bajo los mismos parámetros que para los DVD:
Envejecimiento acelerado ligero en varias marcas de BluRays, los mismos parámetros:
Traducido de este estudio de Archives de France, 2012.
Dos resúmenes de todos los hallazgos (en francés) aquí y aquí .
En resumen, el mejor disco Blu-ray (de Panasonic) se desempeñó de manera similar al DVD de mejor calidad de archivo en la prueba de humedad + temperatura, ¡mientras que es prácticamente insensible a la luz! Y este disco Blu-ray ni siquiera es de archivo. Además, los discos Blu-ray utilizan un código de corrección de errores mejorado que los DVD (ellos mismos usan una versión mejorada en relación con los CD), lo que minimiza aún más los riesgos de pérdida de datos. Por lo tanto, parece que algunos discos BluRay pueden ser una muy buena opción para almacenamiento en frío.
Y, de hecho, algunas empresas están empezando a trabajar en discos Blu-ray de almacenamiento de alta densidad y almacenamiento de alta densidad como Panasonic y Sony. anunciando que podrán ofrecer 300 GB a 1 TB de almacenamiento con una vida útil promedio de 50 años. También, Las grandes empresas se están volcando hacia los medios ópticos para almacenamiento en frío. (ya que consume muchos menos recursos, ya que puede almacenarlos en frío sin necesidad de suministro eléctrico), como Facebook, que desarrolló un sistema robótico para usar discos Blu-ray como "almacenamiento en frío" Para los datos, su sistema rara vez accede.
Iniciativa de archivo de Long Now: Hay otras pistas interesantes como la Proyecto Rosetta Disc por el museo Long Now , que es un proyecto para escribir páginas a escala microscópica del Génesis en todos los idiomas de la tierra a los que se tradujo el Génesis. Este es un gran proyecto, que es el primero en ofrecer un medio que permite almacenar 50 MB para almacenamiento en frío a muy largo plazo (ya que está escrito en carbono), y con acceso preparado para el futuro ya que solo necesita una lupa para acceder al Datos (no hay especificaciones de formatos extraños ni problemas tecnológicos para manejar, como el rayo violeta del Blu-ray, ¡solo necesita una lupa!). Sin embargo, estos todavía se hacen manualmente y, por lo tanto, se estima que cuestan alrededor de $ 20K, lo que es un poco demasiado para un esquema de archivo personal, supongo.
Soluciones basadas en internet : Otro medio para almacenar en frío sus datos está en la red. Sin embargo, las soluciones de copia de seguridad en la nube no son una buena opción, ya que la principal preocupación es que las empresas de alojamiento en la nube no puedan vivir el tiempo que desee para mantener sus datos. Otras razones incluyen el hecho de que la copia de seguridad es horriblemente lenta (ya que se transfiere a través de Internet) y la mayoría de los proveedores requieren que los archivos también existan en su sistema para mantenerlos en línea. Por ejemplo, tanto CrashPlan como Backblaze eliminarán de forma permanente los archivos que no se vean al menos una vez en su computadora en los últimos 30 días, por lo que si desea cargar datos de respaldo que almacena solo en discos duros externos, deberá USB HDD al menos una vez por mes y sincronice con su nube para restablecer la cuenta atrás. Sin embargo, algunos servicios en la nube ofrecen mantener sus archivos por tiempo indefinido (siempre y cuando pague, por supuesto) sin una cuenta atrás, como SpiderOak. Por lo tanto, tenga mucho cuidado con las condiciones y el uso de la solución de copia de seguridad basada en la nube que elija.
Una alternativa a los proveedores de copia de seguridad en la nube es alquilar su propio servidor privado en línea y, si es posible, elegir uno con duplicación / copia de seguridad automática de sus datos en caso de fallas de hardware de su lado (algunos incluso le garantizan la pérdida de datos en sus contratos , pero por supuesto es más caro). Esta es una gran solución, primero porque aún posee sus datos y, segundo, porque no tendrá que administrar los fallos del hardware, esto es responsabilidad de su host. Y si un día su anfitrión cierra su negocio, aún puede recuperar sus datos (elija un anfitrión serio para que no se apaguen durante la noche pero le notifiquen de antemano, tal vez puede pedir que incluya el contrato). y reubicar en otro lugar.
Si no desea la molestia de configurar su propio servidor privado en línea, y si puede costearlo, Amazon ofrece un nuevo servicio de archivo de datos, llamado glaciar . El propósito es exactamente almacenar en frío sus datos a largo plazo: por lo tanto, cuesta mucho almacenar datos en un Glaciar, pero cuesta aún más recuperar estos datos, ya que este servicio se realiza para almacenar datos fuera de alcance , no para guardar los datos a los que desea acceder a menudo. Esto significa que este servicio cotiza precios para escribir datos, pero también para leerlos. Este servicio tiene un costo enorme, pero puede ser una buena oferta para algunos de sus datos más sensibles (es decir, si tiene algunos archivos de texto o imágenes que son MUY razonables, ya que este tipo de datos generalmente es de tamaño pequeño, no te costará mucho almacenar en un glaciar).
Deficiencias de almacenamiento en frío : Sin embargo, hay un gran defecto en cualquier medio de almacenamiento en frío: no hay verificación de integridad, ya que los medios de almacenamiento en frío NO PUEDEN verificar automáticamente la integridad de los datos (solo pueden implementar esquemas de corrección de errores para "curar" un poco del daño después de la corrupción sucedió, pero no se puede prevenir ni administrar automáticamente!) porque, al contrario de lo que ocurre con una computadora, no hay una unidad de procesamiento para computar / registrar / revisar y corregir el sistema de archivos. Mientras que con una computadora y varias unidades de almacenamiento, puede verificar automáticamente la integridad de sus archivos y duplicar automáticamente en otra unidad si es necesario si ocurriera algún daño en un archivo de datos (siempre que tenga varias copias del mismo archivo).
Archivo a largo plazo
Incluso con las mejores tecnologías disponibles en la actualidad, los datos digitales solo pueden almacenarse en frío durante algunas décadas (alrededor de 20 años). Por lo tanto, a largo plazo, no solo puede confiar en el almacenamiento en frío: debe configurar una metodología para su proceso de archivado de datos para garantizar que sus datos puedan recuperarse en el futuro (incluso con cambios tecnológicos) y que minimice los riesgos. de perder tus datos. En otras palabras, necesitas convertirte en el curador digital de sus datos, repare los daños cuando ocurran y vuelva a crear nuevas copias cuando sea necesario.
No hay reglas infalibles, pero aquí hay algunas establecidas estrategias de curación y, en particular, una herramienta mágica que facilitará su trabajo:
- Principio de redundancia / replicación : La redundancia es la única herramienta que puede revertir los efectos de la entropía. , que es un principio basado en la teoría de la información. Para mantener los datos, necesita duplicar estos datos. Los códigos de error son exactamente una aplicación automática del principio de redundancia. Sin embargo, También debe asegurarse de que sus datos sean redundantes : varias copias de los mismos datos en diferentes discos, múltiples copias en diferentes medios (de modo que si un medio falla debido a problemas intrínsecos, hay pocas posibilidades de que los otros en diferentes medios también falle al mismo tiempo), etc. En particular , siempre debe tener al menos 3 copias de sus datos, también denominadas redundancia modular en ingeniería, de modo que si se corrompen sus copias, puede emitir un voto mayoritario simple para reparar sus archivos de sus 3 copias. Recuerde siempre el consejo de la brújula del marinero:
Es inútil traer dos brújulas, porque si uno sale mal, usted
nunca se puede saber cuál es el correcto, o si ambos están equivocados. Siempre toma
Una brújula, o más de tres.
Códigos de corrección de errores : esta es la herramienta mágica que hará su vida más fácil y sus datos más seguros. Los códigos de corrección de errores (ECC) son una construcción matemática que generará datos que pueden usarse para reparar sus datos. Esto es más eficiente, porque Los ECC pueden reparar muchos más datos utilizando mucho menos espacio de almacenamiento que la simple replicación (es decir, hacer copias múltiples de sus archivos), e incluso pueden usarse para verificar si su archivo tiene algún daño, e incluso localiza donde están esas corrupciones . De hecho, esto es exactamente una aplicación del principio de redundancia, pero de una manera más inteligente que la replicación. Esta técnica se usa ampliamente en cualquier comunicación de largo alcance en la actualidad, como 4G, WiMax e incluso las comunicaciones espaciales de la NASA. Desafortunadamente, aunque los ECC son omnipresentes en las telecomunicaciones, no están en reparación de archivos, tal vez porque es un poco complejo. Sin embargo, algunos programas están disponibles, como el conocido PAR2, pero ahora antiguo, DVD Disaster (que ofrece agregar códigos de corrección de errores en discos ópticos) y pyFileFixity (que desarrollo en parte para superar las limitaciones y problemas de PAR2). También hay sistemas de archivos que, opcionalmente, implementan Reed-Solomon, como ZFS para Linux o ReFS para Windows, que técnicamente son una generalización de RAID5.
Comprobar la integridad de tus archivos regularmente : Copie sus archivos y revíselos de vez en cuando (es decir, una vez al año, pero depende del medio de almacenamiento y las condiciones ambientales). Cuando vea que sus archivos sufrieron daños, es hora de reparar utilizando los ECC que generó si lo hizo y / o hacer una nueva copia nueva de sus datos en un nuevo medio de almacenamiento. La verificación de datos, la reparación de daños y la realización de nuevas copias son un buen ciclo de curación que garantizará que sus datos estén seguros. La verificación en particular es muy importante porque las copias de sus archivos pueden corromperse silenciosamente, y si luego copia las copias que han sido manipuladas, terminará con archivos totalmente corruptos. Esto es aún más importante con los medios de almacenamiento en frío, como los discos ópticos, que NO PUEDEN verificar automáticamente la integridad de los datos (ya implementan ECCs para curarse un poco, pero no pueden verificar ni crear nuevas copias automáticamente, ¡ese es su trabajo!) . Para monitorear los cambios de archivos, puede usar el script rfigc.py de pyFileFixity u otras herramientas de UNIX como md5deep . También puede verificar el estado de salud de algunos medios de almacenamiento como discos duros usando herramientas como Centinela del disco duro o el código abierto smartmontools .
Almacena tus archivos medianos. en diferentes lugares (con al menos una copia fuera de su casa) para evitar eventos catastróficos de la vida real, como inundaciones o incendios. Por ejemplo, un disco óptico en su trabajo o una copia de seguridad basada en la nube puede ser una buena idea para cumplir con este requisito (incluso si los proveedores de la nube pueden cerrarse en cualquier momento, siempre que tenga otras copias, estará seguro). , los proveedores de la nube solo servirán como un archivo externo en caso de emergencia).
Almacenar en específico Contenedores con parámetros ambientales controlados. : para medios ópticos, almacene lejos de la luz y en una caja hermética para evitar la humedad. Para discos duros y tarjetas SD, almacene en fundas anti-magnéticas para evitar la electricidad residual para manipular la unidad. También puede almacenar en una bolsa / caja hermética y hermética al agua y almacenar en un congelador: las temperaturas lentas reducirán la entropía, y pueden prolongar bastante la duración de la vida de cualquier medio de almacenamiento como ese (solo asegúrese de que el agua gane). No entres, de lo contrario tu médium morirá rápidamente).
Utilizar hardware de buena calidad y verifíquelos de antemano (por ejemplo, cuando compre una tarjeta SD, pruebe toda la tarjeta con un software como HDD Scan para verificar que todo esté bien antes de escribir sus datos). Esto es particularmente importante para las unidades ópticas, ya que su calidad puede cambiar drásticamente la calidad de sus discos grabados, como lo demuestra el estudio Archives de France (una grabadora de DVD defectuosa producirá DVD que durarán mucho menos).
Elija cuidadosamente sus formatos de archivo: no todos los formatos de archivo son resistentes a la corrupción, algunos incluso son claramente débiles. Por ejemplo, las imágenes .jpg pueden estar totalmente rotas e ilegibles al manipular solo uno o dos bytes. Lo mismo para los archivos 7zip. Esto es ridículo, así que tenga cuidado con el formato de archivo de los archivos que archiva. Como regla general, lo mejor es un texto claro simple, pero si necesita comprimir, use un zip no sólido y para imágenes, use JPEG2 (aún no es de código abierto ...). Más información y opiniones de curadores profesionales. aquí , aquí y aquí .
Almacene junto con sus archivos de datos todos los programas y especificaciones que sean necesarios para leer los datos. Recuerde que las especificaciones cambian rápidamente, y por lo tanto, en el futuro, es posible que sus datos ya no sean legibles, incluso si puede acceder al archivo. Por lo tanto, debería preferir los formatos y el software de código abierto, y almacenar el código fuente del programa junto con sus datos para que siempre pueda adaptar el programa del código fuente para iniciarlo desde un nuevo sistema operativo o computadora.
Hay muchos otros métodos y enfoques disponibles aquí , aquí y en varias partes de internet.
Conclusión
Aconsejo usar lo que pueda tener, pero siempre respete el principio de redundancia (¡haga 4 copias!), Y siempre verifique regularmente la integridad (por lo que debe generar una base de datos de hashes MD5 / SHA1 de antemano) y crear nuevos elementos. Copias en caso de corrupción. Si lo hace, técnicamente puede conservar sus datos todo el tiempo que desee, sea cual sea su medio de almacenamiento. El tiempo entre cada verificación depende de la confiabilidad de sus medios de almacenamiento: si es un disquete, verifique cada 2 meses, si es un Blu-ray HTL, verifique cada 2/3 años.
Ahora en el óptimo, aconsejo para el almacenamiento en frío para utilizar Blu-ray HTL discos o DVD de grado de archivo Discos almacenados en cajas opacas herméticas y almacenados en un lugar fresco. Además, puede usar tarjetas SD y proveedores basados en la nube como SpiderOak para almacenar las copias redundantes de sus datos, o incluso los discos duros si es más accesible para usted.
Utilizar muchos códigos de corrección de errores , te salvaran el dia. También puede hacer varias copias de estos archivos ECC (¡pero las copias múltiples de sus datos son más importantes que las copias múltiples de ECC porque los archivos ECC pueden repararse a sí mismos!).
Todas estas estrategias se pueden implementar utilizando el conjunto de herramientas que estoy desarrollando (código abierto): pyFileFixity . De hecho, esta discusión comenzó con esta herramienta, después de descubrir que no había ninguna herramienta gratuita para administrar completamente la corrección de archivos. Además, consulte el archivo Léame y la wiki del proyecto para obtener más información sobre la corrección de archivos y la curación digital.
En una nota final, realmente espero que se ponga más R & amp; D en este problema. Este es un problema importante para nuestra sociedad actual, ya que cada vez se digitalizan más datos, pero sin ninguna garantía de que esta masa de información sobrevivirá más de unos pocos años. Eso es bastante deprimente, y realmente creo que este problema debería ponerse mucho más en el frente, para que esto se convierta en un punto de mercadotecnia para que los constructores y las empresas creen dispositivos de almacenamiento que puedan durar para las generaciones futuras.
/EDITAR: lea a continuación para una rutina de curación práctica .