OKAY. algunos da para tener en cuenta
Uso Backup Exec 12.x / 13.x, tengo un entorno de servidor 2003/2008 que incluye Exchange.
Tengo una copia de seguridad en disco (Full / Diff) que es independiente de la copia de seguridad en LTO (Full / Diff). Por más de una razón, prefiero no solo hacer una copia de seguridad del disco a la cinta, me gustaría mantener la copia de seguridad directa a LTO.
Actualmente tengo una sola unidad LTO-3 sin ningún tipo de cargador / robot / biblioteca. La caja que sirve a la unidad LTO tiene una tarjeta Adaptec 39160 Ultra160 SCSI . Actualmente uso una cinta para Full (una por semana) y una cinta para Diff (cuatro días a la semana antes de sacar la cinta). La copia de seguridad completa está chocando contra la barrera de 372.5GB y cuando lo hace, la copia de seguridad no termina el sábado, todavía está esperando una cinta el lunes por la mañana.
Ward mencionó poner la segunda cinta completa LTO3 el lunes por la tarde / noche después del horario comercial normal. El problema con esto se compara a continuación:
Flujo normal
- Viernes inserte la cinta LTO3 1 para copia de seguridad completa para la semana 1
- Lunes inserte cinta LTO3 para diferencial
- Martes, miércoles, jueves, los diferenciales usan cinta que se insertó el lunes
- repetir para la semana 2
2 cintas LTO3 para flujo de respaldo completo
- Viernes inserte la cinta LTO3 1 para copia de seguridad completa para la semana 1
- Lunes inserte cinta LTO3 2 para copia de seguridad completa para la semana 1
- Lunes inserte la cinta 1 de LTO3 para la copia de seguridad completa para la semana 1 (para verificar el proceso)
- Lunes inserte la cinta 2 de LTO3 para la copia de seguridad completa para la semana 1 (para verificar el proceso)
- Martes inserte cinta LTO 3 para diferencial
- Miércoles, jueves los diferenciales usan cinta que fue insertada el martes
- repetir para la semana 2
Los intercambios de cinta adicionales comen más de 6 horas hasta el lunes (a partir del momento en que puse la segunda cinta). Si lo hiciera a las 5 p.m., estaría aquí hasta casi la medianoche intercambiando cintas. Eso no cuenta el tiempo de inactividad el sábado / domingo / lunes esperando una cinta.
Ahora podría desactivar el proceso de verificación y guardar dos intercambios de cinta y acortar el proceso de "copia de seguridad" en varias horas, pero no puedo simplemente poner la cinta 2 y alejarme al final del día si no apago la verificación . Hacer que la copia de seguridad se extienda a una segunda cinta alarga el proceso de copia de seguridad, pero también
- Aumenta el número de cintas en la rotación (costo)
- Aumenta el número de cintas en el transporte (tamaño / peso del maletín que va al almacenamiento externo)
- Aumenta la complejidad del proceso de copia de seguridad al hacer que me quede en el sitio después de horas para el proceso de verificación
- Aumenta la complejidad de administrar copias de seguridad / restauraciones desde mi oficina que no está justo al lado de la sala de servidores. Esto se cuadruplica para tratar estos problemas desde casa.
Y sí, no voy a entrar el sábado para sentarme allí por más de 6 horas y cuidar a la unidad de cinta. Me gustaría tener una vida fuera del trabajo. Los días de 12 horas MF son lo suficientemente malos cuando ocurren. No voy a atarme permanentemente a una semana laboral de 6 días.
La unidad de cinta es una Dell PowerVault 110T LTO3. El servidor de respaldo está en Gigabit Ethernet usando solo una NIC y puede llenar una cinta completa en aproximadamente 12 horas.
Puedo cambiar el proceso de copia de seguridad para separar uno de los servidores más intensivos en una copia de seguridad completa en su propio LTO para suspender temporalmente esta decisión, pero pronto creo que tendré que elegir una de estas opciones:
Compre una unidad LTO-3 y aproveche que solo tiene una segunda cinta física disponible.Esta es una opción menos deseable y solo tiene sentido si las unidades LTO-3 son considerablemente más baratas que las unidades LTO-4, lo que no es el caso.Compre una unidad LTO-4 y use las cintas LTO-4 para copias de seguridad completas y use cintas LTO-3 para diferenciales hasta que las cintas LTO-3 se roten y las nuevas cintas LTO4 coincidan con el precio de las cintas LTO3. Esto probablemente me ayudará a superar la copia de seguridad del fin de semana en los próximos años sin tener que intercambiar cintas. Esto también aborda parcialmente el lustrado de zapatos ya que LTO4 tiene una velocidad mínima más baja que LTO3.
Compre algo que pueda alimentar cintas automáticamente. Asumo que no hay algo que pueda agregar al PowerVault 110T y esto significaría la compra de un nuevo dispositivo que tiene la cinta y el cargador en una sola unidad. Esto probablemente no sea rentable en comparación con solo obtener una unidad y cargar cintas manualmente, pero la carga automática de LTO4 sería lo último en conveniencia. Dejaré que el jefe sobre mí decida entre una unidad de cinta única y una unidad de carga automática.
Evan Anderson mencionó en otra solución que podría comprar unidades en este rango de precios
LTO-4 (internal drive, 1 tape / day) - $2,766.00
LTO-4 (autoloader, 1 tape / day) - $4,566.00
pero no sé detalles sobre lo que él o usted recomendaría para la unidad real y, si es necesario, el controlador. Muéstrame una URL nueva (o Dell, o HP, o lo que sea tu proveedor favorito) para tu solución si no te importa buscarla o simplemente me das una marca y un número de modelo y estaré encantado de hacerlo. la pierna trabaja yo mismo.
Estoy buscando hacer una compra necesaria en algún momento antes de que esta rotación de respaldo sea demasiado engorrosa. Probablemente tenga unos meses.
Xenny menciona la antigüedad de los servidores y la velocidad de la copia de seguridad. El servidor de Exchange tiene 6 años (aunque los discos duros son mucho más nuevos). Hay un par de servidores de 4 años en la mezcla con unidades sata de grado de consumo (WD6400AAKS). Los servidores que considero "nuevos" tienen 2 años en este momento.
La copia de seguridad en disco desde el antiguo servidor de intercambio ha sido tan rápida como 2184 MB / min, pero en general la copia de seguridad en disco es tan lenta como la copia de seguridad en cinta en esta configuración. De hecho, la copia de seguridad en disco a veces es más lenta que la copia de seguridad en la unidad de cinta LTO-3. También he tenido problemas con las unidades que fallan y la falta de bahías para agregar más unidades. En general, la copia de seguridad en disco es un problema aún mayor que la transición a LTO3 / 4, pero eso pertenece a una pregunta diferente sobre la falla del servidor si quisiera recibir información sobre ese tema.
Solo elegiré algunos números de una copia de seguridad reciente para darle una idea de las velocidades. Esta no es una lista completa, pero le da una idea sobre la variedad de velocidades involucradas. Planeo actualizar esto pronto en el formato de velocidad antigua MB / min de velocidad de noticias MB / min donde oldspeed es el antiguo SCSI 320 LTO3 y newspeed es el SAS LTO4.
DC C: ~ 850 MB / min
Estado del sistema DC ~ 700 MB / min
Exchange Server C: y estado del sistema ~ 500 MB / min ~ 600 MB / min
Exchange Server D: ~ 1400 MB / min ~ 1200 MB / min
Exchange Server Primero Grupo de almacenamiento ~ 1100 MB / min ~ 700MB / min
Servidor web C: ~ 600 MB / min ~ 950 MB / min
Servidor web E: ~ 1700 MB / min ~ 1950 MB / min
Servidor de archivos C: ~ 500 MB / min
Servidor de archivos E: ~ 1500 MB / min ~ 2200 MB / min
Servidor de archivos G: ~ 1800 MB / min ~ 2400 MB / min
Estado del sistema del
servidor de archivos ~ 650 MB / min servidor de fax C: ~ 400 MB / min ~ 550 MB / min
Servidor de contabilidad C: ~ 1300 MB / min ~ 1775 MB / min
Servidor de contabilidad D: ~ 1500 MB / min ~ 2250 MB / min
Instancia SQL contable ~ 1600 MB / min
Servidor de aplicación C: y estado del sistema ~ 700 MB / min ~ 900
Servidor de respaldo MB / min C: 700 MB / min ~ 1800 MB / min
Servidor de respaldo E: 1350 MB / min ~ 2900 MB / min
Supervisando el servidor de archivos Vi números que me hacen pensar que el controlador de banda está frenando las tasas de transferencia. El controlador es SATA 1.5 pero las unidades son compatibles con 3.0. Me di cuenta después de cambiar los volúmenes de RAID 1 a RAID 10 y no obtener un aumento en la velocidad de las copias de seguridad. Desafortunadamente, duplicar la velocidad de lectura sostenida no tuvo ningún efecto en la copia de seguridad en la unidad de cinta LTO3.
En general, el respaldo directo a LTO me da un punto de referencia decente de donde mis servidores tienen E / S limitadas. Los servidores que están realizando copias de seguridad por debajo de 1500 MB / min son generalmente lentos en cuanto a disco y los que están entre allí y 2400 MB / min siguen siendo fruta baja. Por ejemplo, el servidor de Exchange 2003 se está quedando sin espacio en disco y continúa expandiendo la base de datos para el primer grupo de almacenamiento a porciones más lentas de los discos. Este servidor será reemplazado por un servidor Exchange 2010 con procesadores más rápidos y más discos. Los otros servidores recibirán actualizaciones de disco y / o SSD añadidos.
http://en.wikipedia.org/wiki/Tape_drive menciona "Cuando se produce el brillo del zapato , afecta significativamente la velocidad de datos alcanzable, así como la vida útil de la unidad y la cinta". pero no menciona el brillo del zapato reduciendo la capacidad efectiva de una cinta. Después de mirar las cintas de archivo del banco, puedo confirmar que se desperdició entre un 2% y un 15% de espacio en las cintas LTO3. No está lo suficientemente cerca como para evitar que me mude a LTO4 o un cargador automático, pero podría ser significativo. Para aquellos de ustedes con Backup Exec, pueden calcular el desperdicio de limpiabotas de la siguiente manera:
- Realizar un trabajo de respaldo que respaldará alrededor del 100% de la capacidad nativa de las cintas sin compresión. Desactive la compresión en la unidad y el software cuando ejecute la prueba.
- mire en la pestaña de medios de Backup Exec y compare la columna "capacidad usada" con la columna "Datos". Si la compresión está desactivada y los números coinciden, no estás limpiando zapatos en absoluto.
En mi caso, tenía una cinta de archivo LTO3 con 272.4 GB "usados" pero solo 233.67 GB "datos" y otra con 400.6 GB versus 395.19 GB. También probé una copia de seguridad en LTO4 sin compresión y obtuve 833 GB "usados" con solo 786.77 GB "datos". Obviamente, el lustrado de zapatos variará de mi entorno al tuyo, pero antes de esto no pensé en probarlo. Con suerte, esto le dejará claro cómo averiguar cuánta cinta desperdiciada tiene en su entorno de copia de seguridad.
editar: nueva información en http://www.fujifilmusa.com/shared/bin/LTO_Overview.pdf que muestra las velocidades mínimas de cinta para LTO3 y LTO4. Parece que el IBM LTO4 en realidad tiene una velocidad mínima más baja que el IBM LTO3. De cualquier manera, mi servidor promedio es demasiado lento para alimentar LTO3 / 4 sin limpiabotas. Me preocupa que incluso mi copia de seguridad en los volúmenes locales del disco sea demasiado lenta para alimentar la unidad rápidamente, pero tendré que probar eso.
Al obtener la información de la unidad de altura completa de IBM del PDF anterior, obtengo
LTO4 : 30-120MB/s 800GB native (45-240MB/s compressed)
LTO3 : 40- 80MB/s 400GB native (60-160MB/s compressed)
LTO2 : 18- 35MB/s 200GB native (27- 70MB/s compressed)
LTO1 : 15- 15MB/s 100GB native (30- 30MB/s compressed)
Actualización : el servidor que estaba usando para la copia de seguridad comenzó a darme errores de detención, así que moví la unidad de cinta a otro servidor. El antiguo controlador SCSI era un Adaptec 160, el "nuevo" controlador es un 320 basado en LSI (al menos supongo que el conector externo es un 320 ya que los 4 discos duros dentro del servidor mencionan 320 SCSI en la administración del servidor).
La nueva situación del servidor me deja sin respaldo en el disco temporalmente hasta que obtenga un gabinete externo para almacenamiento conectado directamente. En general, esta discusión de LTO me ha apuntado a comprar más discos duros para mis servidores. Tendré que trabajar para reconfigurar las matrices RAID para aumentar la velocidad de la copia de seguridad y, con suerte, aumentar la confiabilidad de la configuración general.
Actualización 2 : la comparación a continuación utiliza un antiguo servidor de archivos cuyo controlador de incursión bloquea todas las transferencias a ~ 40 MB / s, por lo que lo ideal sería aproximadamente 2400 MB / min. Esto se trata de la velocidad necesaria para probar el borde del zapato brillante. Presumiblemente, el flujo de datos no será perfectamente regular y forzará la coincidencia de velocidad casi durante toda la prueba.
Ya no conozco el tamaño del búfer y el recuento del búfer que utilicé en la prueba de velocidad del antiguo disco LTO3, pero no cambia mucho en absoluto. Obtuve una ganancia de 100 MB / min al ajustar los búferes. Los datos de prueba son aproximadamente 20 GB de archivos tif y jpgs escaneados. Hice estas pruebas un viernes por la tarde y no repetí las pruebas suficientes veces para promediar los datos o descartar datos no válidos. Las pruebas después de horas, la elección de diferentes datos y otras variables podrían afectar notablemente estas pruebas.
Se utilizan los mismos servidores en todas las pruebas. La unidad anterior está en un controlador 320 SCSI LVD que es PCIx. La nueva unidad está en un controlador SAS PCIe LSI 3801E. Es posible que el controlador de la unidad y / o la unidad de cinta LTO3 sean cuellos de botella. No probaré los componentes individuales, solo el emparejamiento anterior versus el nuevo emparejamiento. El servidor que ejecuta Backup Exec tiene 4GB de ram, 32bit Server 2008 estándar, Pentium D 3.2GHz CPU de doble núcleo.
La conectividad de red es a través de un conmutador de 1 Gb, ambos servidores están en el mismo conmutador. Tengo una conexión de escritorio remoto abierta, pero con la copia de seguridad activada + esa conexión, la conexión Gb se utiliza menos del 50% en el peor de los casos y promedia más como el uso del 25%.
Entonces, a pesar de lo toscos que son los métodos de prueba, me siento razonablemente seguro de que los cuellos de botella no están en una variable que estoy ignorando.
Resultados de prueba cortos :
~ 1500 MB / min usando la unidad Dell LTO3 y la compresión de cinta LTO3 activada, tamaño de bloque de 64 KB (muchos conteos de búfer probados, el mejor resultado se enumera aquí)
~ 1800 MB / min usando la unidad Quantum Superloader3 LTO 4 con una cinta LTO3 (la misma cinta que la anterior), compresión activada, tamaño de bloque de 64 KB, tamaño de búfer de 64 KB, conteo de búfer 10, conteo de agua alta 0, modo de bloque de escritura simple activado, paso SCSI de escritura a través del modo ON
~ 2150 MB / min utilizando la unidad Quantum Superloader3 LTO 4 con una cinta LTO3 (la misma cinta que la anterior), compresión activada, tamaño de bloque de 256 KB, tamaño de búfer de 256 KB, recuento de búfer 10, recuento de agua alta 0, modo de bloque de escritura simple activado, paso SCSI de escritura a través del modo ENCENDIDO
~ 2200 MB / min usando la unidad Quantum Superloader3 LTO 4 con una cinta LTO3 (misma cinta que la anterior) compresión APAGADA, tamaño de bloque de 256 KB, tamaño de búfer de 256 KB, recuento de búfer 10, recuento de agua alta 0, escritura Modo de bloque único ENCENDIDO, escritura Modo de paso SCSI activado
~ 2050 MB / min utilizando la unidad Quantum Superloader3 LTO 4 con una compresión de cinta LTO4 activada, tamaño de bloque de 256 KB, tamaño de búfer de 256 KB, recuento de búfer 10, recuento de agua alta 0, modo de bloque de escritura simple activado, modo de paso SCSI de escritura activado
~ 2250 MB / min utilizando la unidad Quantum Superloader3 LTO 4 con una compresión de cinta LTO4 desactivada, tamaño de bloque de 256 KB, tamaño de búfer de 256 KB, recuento de búfer 10, recuento de agua alta 0, modo de bloque de escritura simple activado, modo de paso SCSI de escritura activado
~ 2050 MB / min usando la unidad Quantum Superloader3 LTO 4 con una compresión de cinta LTO4 activada, tamaño de bloque de 256 KB, tamaño de búfer de 1 MB, recuento de búfer 10, recuento de agua alta 0, modo de bloque único de escritura activado, modo de paso SCSI de escritura activado
~ 2300 MB / min usando la unidad Quantum Superloader3 LTO 4 con una compresión de cinta LTO4 desactivada, tamaño de bloque de 256 KB, tamaño de búfer de 1 MB, recuento de búfer 10, recuento de agua alta 0, modo de bloque de escritura simple activado, modo de paso SCSI de escritura activado
~ 2200 MB / min utilizando la unidad Quantum Superloader3 LTO 4 con una compresión de cinta LTO4 activada, tamaño de bloque de 256 KB, tamaño de búfer de 1 MB, recuento de búfer 20, recuento de agua alta 0, modo de bloque de escritura simple activado, modo de paso SCSI de escritura activado
~ 2300 MB / min usando la unidad Quantum Superloader3 LTO 4 con una compresión de cinta LTO4 desactivada, tamaño de bloque de 256 KB, tamaño de búfer de 1 MB, conteo de búfer 20, conteo de agua alta 0, modo de bloque de escritura simple activado, modo de paso SCSI de escritura activado
Está claro que el tamaño del bloque de ajuste es más importante que el tamaño del búfer. No importa el tamaño de bloque o búfer que utilice, obtendrá un mejor rendimiento al desactivar la compresión si sus datos de origen no pueden mantenerse al día con la tasa de coincidencia de datos mínima de las unidades de cinta. Desafortunadamente, esta es una configuración por unidad, no por trabajo o por formato de cinta, por lo que no puede limitar la compresión a copias de seguridad completas o solo a LTO3. También tendrá que probar qué tan problemático es su combinación de hardware / software. Por supuesto, ese éxito en el rendimiento es menor y las pruebas más importantes serán optimizar la copia de seguridad completa de 600 GB a 800 GB en lugar de 20 GB. Intentaré actualizar nuevamente una vez que tenga algunas semanas o meses de copias de seguridad realizadas.