Opciones para acceder rápidamente y realizar copias de seguridad de millones de archivos
Pedir prestado a personas con problemas similares
Esto se parece mucho a un tipo de problema más fácil que enfrentan los servidores de noticias USENET y los servidores proxy de almacenamiento en caché: cientos de millones de archivos pequeños a los que se accede aleatoriamente. Es posible que desee tomar una pista de ellos (excepto que normalmente no tienen que hacer copias de seguridad).
http://devel.squid-cache.org/coss/coss-notes.txt
http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=4074B50D266E72C69D6D35FEDCBBA83D?doi=10.1.1.31.4000&rep=rep1&type=pdf
Obviamente, la naturaleza cíclica del sistema de archivos de noticias cíclicas es irrelevante para usted, pero el concepto de nivel inferior de tener múltiples archivos / dispositivos de disco con imágenes empaquetadas y un índice rápido de la información que proporciona el usuario para buscar la información de ubicación es muy apropiado.
Sistemas de archivos dedicados
Por supuesto, estos son conceptos similares a los que hablaban las personas al crear un sistema de archivos en un archivo y montarlo sobre un bucle invertido, excepto que puede escribir su propio código del sistema de archivos. Por supuesto, dado que usted dijo que su sistema era principalmente de lectura, en realidad podría dedicar una partición de disco (o partición lvm para flexibilidad en el dimensionamiento) para este único propósito. Cuando desee realizar una copia de seguridad, monte el sistema de archivos de solo lectura y luego haga una copia de los bits de partición.
LVM
Mencioné LVM arriba como útil para permitir el tamaño dinámico de una partición para que no necesite hacer una copia de seguridad de mucho espacio vacío. Pero, por supuesto, LVM tiene otras características que podrían ser muy aplicables. Específicamente, la funcionalidad de "instantánea" que le permite congelar un sistema de archivos en un momento dado. Cualquier accidente rm -rf
o lo que sea no perturbaría la instantánea. Dependiendo exactamente de lo que intente hacer, eso podría ser suficiente para sus necesidades de copias de seguridad.
RAID-1
Estoy seguro de que ya está familiarizado con RAID y probablemente ya lo use para la confiabilidad, pero RAID-1 también se puede usar para copias de seguridad, al menos si está usando RAID de software (puede usarlo con RAID de hardware, pero eso en realidad le brinda una confiabilidad menor porque puede requerir el mismo modelo / controlador de revisión para leer). El concepto es que cree un grupo RAID-1 con un disco más del que realmente necesita conectado para sus necesidades normales de confiabilidad (por ejemplo, un tercer disco si usa el software RAID-1 con dos discos, o tal vez un disco grande y un hardware) RAID5 con discos más pequeños con un software RAID-1 en la parte superior del hardware RAID-5). Cuando llegue el momento de hacer una copia de seguridad, instale un disco, solicite a mdadm que agregue ese disco al grupo de incursiones, espere hasta que indique que está completo, opcionalmente solicite un exfoliante de verificación y luego retire el disco. Por supuesto,