Estoy empezando a ver clientes con cientos de terabytes de datos (en instalaciones de SQL Server). A medida que el volumen total de datos en algunas empresas se acerca a fracciones significativas de un petabyte, me gustaría examinar la base de conocimiento colectivo para ver qué están haciendo las personas que manejan esa magnitud de datos para salvaguardarla.
El problema obvio es que almacenar múltiples copias de seguridad de esa cantidad de datos es prohibitivamente costoso, utilizando almacenamiento de clase empresarial, diablos, incluso solo RAID-5.
Las opciones que veo son las siguientes:
- Cree una copia reflejada de los datos en otro centro de datos y envíele continuamente diferencias (utilizando cualquier mecanismo disponible para su fuente de datos, por ejemplo, envío de registros o reflejo de base de datos con SQL Server)
- Realice copias de seguridad periódicas utilizando un algoritmo de compresión fuerte (probablemente solo sea adecuado si los datos se prestan bien a una gran compresión)
- Realice copias de seguridad por partes de las partes críticas / cambiantes de los datos.
- No respalde los datos y confíe en los dioses de la corrupción.
Veo que se adopta la opción n. ° 4 como predeterminada, y como experto en HA / DR es realmente aterradora, pero ¿qué aconsejo como alternativa? Creo que el n. ° 1 es el mejor enfoque, pero "No lo creo" es la respuesta habitual cuando se sugiere cualquier alternativa aparte del n. ° 4 y posiblemente el n. ° 3.
Ahora, por supuesto, depende de la tasa de cambio y la criticidad de los datos. No es necesario responder con eso, ya que solía ser responsable de todas las características de HA de SQL Server mientras trabajaba en Microsoft, así que estoy bien versado en los argumentos de 'depende', esa es mi frase clave :-)
Me interesaría mucho saber de cualquier alternativa que me haya perdido, o escuchar que todos los demás están en el mismo barco y que no hay una alternativa realista a gastar mucho dinero en más almacenamiento.
Gracias de antemano: se dará el debido crédito a todas las respuestas bien pensadas y expresadas.