Tengo un conjunto de archivos que me gustaría comprimir que sé que son repetitivos y compresibles, pero 7zip elige un orden no óptimo para comprimir los archivos y no aprovecha su capacidad de compresión. ¿Cómo puedo obtener 7zip para comprimir los archivos en otro orden?
Los archivos que quiero comprimir son los siguientes:
- Un PDF de 200 MB que contiene una gran cantidad de archivos JPG incrustados
- 190 MB de archivos JPG, todos los cuales están incorporados por separado en el PDF
- Alrededor de 500 MB de otros varios compresible moderadamente archivos
Sé que es posible que 7zip aproveche la repetición entre el PDF y los JPG simples, porque cuando archivo los PDF y los JPG juntos, obtengo una relación de compresión del 47%. Pero cuando trato de incluir los 500 MB de otros archivos, 7zip comprime primero los archivos JPG, luego los otros datos misceláneos, y en el momento en que llega al PDF, el algoritmo de compresión debe haberse "olvidado" de los JPG porque el PDF es difícilmente comprimido en absoluto.
Con 7-zip 9.32 alpha, usando el formato de archivo 7z, el nivel de compresión ultra, el algoritmo LZMA2, el tamaño del diccionario de 256MB, el tamaño de 128 palabras, el tamaño de bloque sólido de 4GB y 2 subprocesos de CPU, obtengo las siguientes relaciones de compresión:
- Sólo PDF: 93%
- Sólo JPG: 95%
- PDF y JPG juntos: 47%
- Misceláneo solo archivos: 44%
- Misceláneo Archivos y PDF: 55%.
- Misceláneo Archivos y PDF y JPGs: 63%.
Desde lo misc. los archivos se pueden comprimir a un 44% de su tamaño original, y los archivos PDF y JPG juntos se pueden comprimir a un 47%, esperaría que todos juntos fueran compresibles en algún lugar en el extremo inferior del 44-47%, pero debido al mal ordenamiento de Archivos por 7zip, obtengo un resultado significativamente peor.
He intentado alterar el orden 7zip comprime archivos jugando con la creación de archivos, la modificación y las fechas de acceso. He intentado mover los archivos a otra carpeta y volver a copiarlos para que se vuelvan a escribir en el disco de forma consecutiva. Incluso he intentado archivar todos los archivos JPG en un archivo zip con compresión a nivel de tienda, para que su tamaño de archivo coincida aproximadamente con el PDF. No importa lo que haga, parece que no puedo hacer 7zip para comprimir el PDF y los JPG sin los misc. archivos intermedios.
¿Algunas ideas? No puedo aumentar el tamaño del diccionario debido a limitaciones de memoria.