Un cliente intentaba enviarme 250 GB de archivos. Después de intentar varias formas de compartir los datos, me envió una carpeta comprimida de solo 4 GB de tamaño. Eso me suena a demasiada compresión: no creo que cuando haya comprimido cosas haya reducido más del 20% del tamaño.
¿Cuáles son algunas relaciones de compresión sin pérdida típicas que uno vería en la práctica? (O, alternativamente, un rango).
ACTUALIZACIÓN: Me doy cuenta de que es imposible decirlo sin poder adivinar el contenido real de la información, por lo que tal vez esta fue una pregunta mal formulada. No puedo compartir los datos del cliente. Pero mirando los XML
archivos, hay muchas frases repetidas, por ejemplo
<thing>
<property="1" value="2" />
<property="3" value="4" />
<property="5" value="6" />
<property="7" value="8" />
<property="9" value="10" />
<property="11" value="12" />
<property="13" value="14" />
</thing>
lo cual parece bastante compresible.
1000000000 null bytes
sería una relación de compresión de 50,000,000: 1.)