Los sistemas de gestión de bases de datos implementan su propio diario a través de los registros de la base de datos, por lo que la instalación de tal DBMS en un sistema de archivos con diario degrada el rendimiento a través de dos mecanismos:
El registro redundante aumenta la cantidad de actividad del disco
El diseño del disco físico puede fragmentarse (aunque algunos sistemas de archivos de diario tienen mecanismos para limpiar esto).
Mucha actividad de disco puede llenar el diario, causando condiciones espurias de "disco lleno".
Hace unos años, vi una instancia en la que esto se hizo en el sistema de archivos LFS en una instalación de Baan en una caja HP / UX. El sistema tenía problemas persistentes de rendimiento y corrupción de datos que no se diagnosticaron hasta que alguien descubrió que los sistemas de archivos estaban formateados con LFS.
Los volúmenes que contienen archivos de base de datos normalmente tendrán una pequeña cantidad de archivos grandes. Los servidores DBMS normalmente tendrán una configuración que configura cuántos bloques se leen en una sola E / S. Los números más pequeños serían apropiados para sistemas de procesamiento de transacciones de alto volumen, ya que minimizarían el almacenamiento en caché de datos redundantes. Los números más grandes serían apropiados para sistemas como almacenes de datos que hicieron muchas lecturas secuenciales. Si es posible, ajuste el tamaño del bloque de asignación del sistema de archivos para que sea del mismo tamaño que la lectura de bloques múltiples en la que está configurado el DBMS.
Algunos sistemas de administración de bases de datos pueden funcionar con particiones de disco sin procesar. Esto proporciona diversos grados de ganancia de rendimiento, generalmente menos en un sistema moderno con mucha memoria. En sistemas más antiguos con menos espacio para almacenar en caché los metadatos del sistema de archivos, los ahorros en disco de E / S fueron bastante significativos. Las particiones sin formato hacen que el sistema sea más difícil de administrar, pero proporcionan el mejor rendimiento disponible.
Los volúmenes RAID-5 generan más gastos generales de escritura que los volúmenes RAID-10, por lo que una base de datos ocupada con mucho tráfico de escritura funcionará mejor (a menudo mucho mejor) en un RAID-10. Los registros deben colocarse volúmenes de disco físicamente separados en los datos. Si su base de datos es grande y en su mayoría es de solo lectura (por ejemplo, un almacén de datos), puede haber un caso para colocarla en volúmenes RAID-5 si esto no ralentiza indebidamente el proceso de carga.
El almacenamiento en caché de reescritura en un controlador puede brindarle una ganancia de rendimiento a expensas de crear algunos modos de falla (razonablemente improbables pero posibles) donde los datos podrían corromperse. La mayor ganancia de rendimiento para esto es en cargas de acceso altamente aleatorio. Si desea hacer esto, considere colocar los registros en un controlador separado y deshabilitar el almacenamiento en caché de reescritura en los volúmenes de registro. Los registros tendrán una mejor integridad de datos y una sola falla no puede eliminar tanto el volumen de registro como el de datos. Esto le permite restaurar desde una copia de seguridad y avanzar desde los registros.