Respuestas:
La deduplicación es donde observa el contenido de un conjunto de datos, observa todos los bits duplicados que están presentes y almacena los datos una sola vez, reemplazando todas esas copias de datos con un puntero de vuelta a la copia. Es particularmente útil con las copias de seguridad porque cuando haces copias de seguridad de cosas como servidores, gran parte de los datos son los mismos. Imagine, por ejemplo, que está haciendo una copia de seguridad de 1,000 servidores de Windows: gran parte del contenido de esos cuadros será idéntico.
La deduplicación es tan popular hoy por 3 razones:
Últimamente todos están obsesionados con la creación de soluciones de recuperación ante desastres que utilizan servidores externos. Para hacer esto, debe replicar una gran cantidad de datos de producción en el sitio remoto y el ancho de banda es un gran problema. Cualquier reducción en la cantidad de datos que tiene que replicar ayuda mucho.
La cantidad de datos que las compañías están reteniendo está explotando, gracias al almacenamiento más barato y a los requisitos de múltiples industrias para la retención de registros.
La tecnología relativamente recientemente alcanzó el punto óptimo. Hemos tenido cosas como la deduplicación durante mucho tiempo (almacenamiento de instancia única, etc.) que ha ayudado, pero solo en el último año más o menos hemos visto una deduplicación real que puede reducir significativamente la cantidad de almacenamiento en la corriente principal.
Una de las cosas que descubrimos en mi empresa al trabajar con Netapp es que la deduplicación realmente solo funciona bien en un entorno VM si tiene sus unidades alineadas. Lo cual es un problema para nosotros, ya que tenemos muchas máquinas con Windows Server 2003 y ninguna de las unidades está alineada. Lo que significa que apenas se recupera alrededor de un cuarto del espacio posible si las unidades están alineadas correctamente.
Sin embargo, se nos dice que una vez que las unidades estén alineadas correctamente, deberíamos poder recuperar el 40-60% de nuestro espacio con dedup.