Acabo de hacer una copia de seguridad de una base de datos de SQL Server. Los archivos MDF y LDF juntos totalizan alrededor de 29 GB, pero el archivo .bak solo tenía 23 GB, aproximadamente un 20% más pequeño.
Mi primera suposición cuando una versión de un conjunto de datos es más pequeña que otra versión que contiene los mismos datos sería la compresión de datos, pero la compresión generalmente produce una relación de compresión mucho mejor que el 20%, especialmente para datos altamente ordenados (como tablas de bases de datos. ) Además, los datos comprimidos no pueden comprimirse más fácilmente, pero sé que los archivos .bak pueden comprimirse.
Entonces, si los datos no se comprimen y no se descarta nada (porque el objetivo principal de hacer una copia de seguridad es poder restaurarlos a un estado idéntico después), entonces, ¿cuál es ese 20% que no se tiene en cuenta?