¿Un programa de compresión de archivos más eficiente para muchos archivos idénticos?


12

Estoy haciendo una copia de seguridad de mi trabajo y estoy buscando un programa que pueda comprimir archivos de manera más eficiente. El programa de compresión predeterminado de Windows funciona bien, pero no funciona tan "inteligente" como me gustaría.

Mis archivos son básicamente instantáneas enteras de mi trabajo tomadas en los últimos meses mientras hago mis copias de seguridad completas habituales. No hay muchos cambios entre las copias de seguridad y muchos archivos son simplemente copias entre sí.

Todo mi conjunto de archivos es de aproximadamente 15 GB sin comprimir, mientras que las copias de seguridad de instantáneas individuales (comprimidas mediante programas de compresión estándar) son de aproximadamente 150 a 200 MB cada una (normalmente aumentan de tamaño con fechas más recientes). El tamaño total de todas las instantáneas comprimidas es de aproximadamente 3 GB. Debido a la naturaleza de los archivos, espero que un programa de compresión "inteligente" reduzca todo el volumen a alrededor de 400-500 MB, es decir, teniendo en cuenta ineficiencias razonables y espacio adicional para comprimir las diferencias en los archivos.

¿Existe un programa de compresión que aproveche el hecho de que muchos archivos son idénticos para lograr una relación de compresión mucho mayor que el programa de compresión estándar de Windows?

Gracias -Despertado

Editar: Acabo de terminar una mejor compresión de todo el volumen usando la compresión estándar de Windows. Es solo 10 MB mejor que las instantáneas comprimidas combinadas. En mi opinión, es inaceptable conocer la naturaleza de los archivos.


¿En qué versión de windows?
John T

1
Je, es vista ...

3
¿No sería mejor cambiar al control de versiones en lugar de esas copias de seguridad? Estoy usando git también para archivos binarios y funciona muy bien. No creo que pueda comprimirlo tan bien como 7z, pero ¿importa si se necesitan 150 MB o 300 MB? Si no, optaría por la facilidad de uso y la flexibilidad.
maaartinus

Respuestas:


18

7-zip admite compresión sólida si no recuerdo mal, por lo que debería comprimir muy bien muchos archivos casi idénticos.


2
+1, y considere el formato 7z predeterminado .
nik

Lo intentaré, te responderé con los resultados.

2
Después de 1 hora de compresión en la configuración más alta, obtuve un tamaño de archivo de 133 MB. ¡Esto es muy impresionante! Mi estimación agresiva original (que no dije) era un tamaño de archivo de aproximadamente 150 MB (esto se opone a mi estimación conservadora declarada de 400-500 MB). ¡Parece que de ahora en adelante me convertiré a 7z!

Incluso si necesita apegarse al formato Zip estándar, 7-zip tiene un mejor rendimiento que otras herramientas de compresión populares (WinRAR, WinZip) con la configuración de eficiencia más alta.
christophem

7 zip es literalmente una de las primeras herramientas que puse en una nueva caja. Es demasiado útil
corsiKa

6

Hice algunas pruebas sobre el aspecto de "archivos idénticos", como se menciona en la pregunta, usando 7-zip (versión 9.20), ya que nadie dio una respuesta elaborada sobre eso, todavía. Esto dio algunos resultados interesantes. Probé con 10 copias del archivo que este sitio usa para su mensaje de página no encontrada . Este archivo no se comprimirá muy bien como un archivo individual, ya que es un archivo jpg. Por lo tanto, demostrará la eficiencia de comprimir múltiples archivos idénticos. Su tamaño de archivo es de 37 KB.

  1. Cuando comprimo las diez copias, en formato zip, el tamaño del archivo es de 367 KB, con un tamaño comprimido de aproximadamente el 99% del tamaño total original de los 10 archivos.
  2. Cuando comprimo las diez copias, usando el formato 7z, el tamaño del archivo es de 37 KB, con un tamaño comprimido de aproximadamente el 101% de solo uno de los archivos originales.
  3. Si primero coloco 5 copias en un archivo 7-z, luego agrego 3 y finalmente 2 copias en pasos separados, el tamaño del archivo se convierte en 111 KB, aproximadamente tres veces el tamaño de un solo archivo original.

Si abro el tercer archivo, una de las propiedades es Bloquear . Esto enumera 0, 1 y 2 para 3, 5 y 2 de los archivos, respectivamente.

Observaciones:

  1. El formato zip comprimirá cada archivo individualmente, sin beneficiarse de la posibilidad de comprimir eficientemente archivos idénticos.
  2. El formato 7z comprimirá de manera eficiente múltiples archivos idénticos, siempre que se agreguen al archivo en un solo paso.

Conclusiones:

  1. Para compresiones óptimas de archivos, use 7z en lugar de zip.
  2. La compresión puede mejorar drásticamente si no agrega archivos a un archivo 7z existente, pero primero lo descomprime y lo comprime nuevamente, incluidos los archivos nuevos, en un solo paso.

1

Windows Vista viene con Centro de copia de seguridad y restauración . Hará copias de seguridad incrementales de sus archivos para evitar perder espacio y tener que crear varias copias de seguridad. Desde la página vinculada:

Las versiones de archivos respaldadas anteriormente usan solo un mínimo de espacio en disco. Si solo cambia una pequeña parte de un archivo (como una diapositiva en una presentación), solo esa parte se rastrea y guarda.


1

7-zip tiene uno de los mejores algoritmos de compresión. No creo que haya nada que supere a 7-zip en compresión (algoritmo) hasta ahora.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.