Soy un estudiante graduado, y el grupo en el que trabajo mantiene un clúster de Linux. Cada nodo del clúster tiene su propio disco local, pero estos discos locales son relativamente pequeños y no están equipados con copia de seguridad automática. Por lo tanto, el grupo posee un servidor de archivos con muchas TB de espacio de almacenamiento. Soy un novato relativo de Linux, por lo que no estoy seguro de cuáles son las especificaciones del servidor de archivos en términos de velocidad, capacidad de red, etc. Sé por experiencia que los discos locales son significativamente más rápidos que el servidor de archivos en términos de E / S . Alrededor de una docena de personas usan el servidor de archivos.
El uso cp
para copiar un archivo de ~ 20 GB del servidor de archivos a uno de los discos locales demora aproximadamente 11.5 minutos en tiempo real en promedio (según time
). Sé que esta cp
operación no es muy eficiente porque (1) time
me dice que el tiempo del sistema para tal copia es de solo ~ 45 segundos; y porque (2) cuando examino top
durante la copia, % CPU es bastante bajo (por inspección, aproximadamente 0-10% en promedio).
Usar cp
para copiar el mismo archivo de ~ 20 GB de una carpeta en el disco local a otra carpeta en el mismo disco local toma menos tiempo, aproximadamente 9 minutos en tiempo real (~ 51 segundos en tiempo del sistema, según time
). Entonces, aparentemente el servidor de archivos es algo más lento que el disco local, como se esperaba, pero quizás no significativamente más lento. Me sorprende que copiar de local a mismo local no sea más rápido que 9 minutos.
Necesito copiar ~ 200 archivos grandes, cada ~ 20 GB, del servidor de archivos a uno de los discos locales. Entonces, mi pregunta es: ¿Existe una alternativa más rápida cp
para copiar archivos grandes en Linux? (¿O hay algún indicador dentro de cp
eso que podría usar que aceleraría la copia?) Incluso si de alguna manera pudiera reducir un minuto este tiempo de copia, eso sería de gran ayuda.
Estoy seguro de que comprar discos de hardware nuevos y más rápidos, pero no tengo acceso a dichos recursos. Tampoco soy administrador del sistema, solo soy un usuario (novato), por lo que no tengo acceso a información más detallada sobre la carga que hay en los discos. Sé que, si bien alrededor de una docena de personas usan el servidor de archivos a diario, soy la única persona que usa este nodo particular / disco local.
dd
y rsync
comparar cuál funciona más rápido en su entorno
dd
, pero solo lo intenté rsync
. El tiempo real fue de aproximadamente 11.5 minutos y el tiempo del sistema fue de aproximadamente 1.5 minutos, según time
.
/dev/sda1
a /dev/sdb1
va a ser más rápido que copiar de una ubicación /dev/sda1
a otra ubicación /dev/sda1
u otra partición /dev/sda
porque el disco duro no tendrá que hacer búsquedas adicionales entre lecturas y escrituras (suponiendo que los discos duros tradicionales con discos giratorios y cabezas móviles; SSD es obviamente diferente).