Accidentalmente sobrescribí ambos ZIL en la última versión de OpenSolaris, lo que provocó la pérdida irrevocable de todo el grupo. (¡Error realmente grave de mi parte! No entendí que perder el ZIL significaría perder el grupo. Afortunadamente se recuperó de la copia de seguridad con el tiempo de inactividad).
Sin embargo, desde la versión 151a (no sé de antemano cómo significa la versión de ZPool), este problema se ha solucionado. Y puedo testificar que funciona.
Aparte de eso, he perdido CERO datos en un servidor de 20tb, incluso debido a varios casos más de error del usuario, fallas múltiples de energía, mala administración del disco, configuraciones incorrectas, numerosos discos fallidos, etc. Aunque la administración y Las interfaces de configuración en Solaris cambian con frecuencia y enloquecedor de una versión a otra y presentan un objetivo significativo de habilidades siempre cambiantes, sigue siendo la mejor opción para ZFS.
No solo no he perdido datos en ZFS (después de mi terrible error), sino que me protege constantemente. Ya no experimento corrupción de datos, lo que me ha afectado durante los últimos 20 años en cualquier número de servidores y estaciones de trabajo, con lo que hago. La corrupción de datos silenciosa (o simplemente "bastante silenciosa") me ha matado varias veces, cuando los datos salen de la rotación de la copia de seguridad, pero de hecho se han dañado en el disco. O en otros escenarios donde las copias de seguridad respaldaron las versiones corruptas. Este ha sido un problema mucho más grande que simplemente perder datos a lo grande de una vez, lo que casi siempre se respalda de todos modos. Por esta razón, me encanta ZFS y no puedo entender por qué la suma de comprobación y la curación automática no han sido características estándar en los sistemas de archivos durante una década. (Por supuesto, los sistemas verdaderamente de vida o muerte generalmente tienen otras formas de asegurar la integridad,
Palabra inteligente: si no desea descender a ACL-hell, no use el servidor CIFS integrado en ZFS. Usa Samba. (Sin embargo, dijiste que usas NFS).
No estoy de acuerdo con el argumento SAS vs. SATA, al menos la sugerencia de que SAS siempre se prefiere sobre SATA, para ZFS. No sé si ese comentario [s] hacía referencia a la velocidad de rotación del plato, la supuesta fiabilidad, la velocidad de la interfaz o algún otro atributo [s]. (O tal vez simplemente "cuestan más y, en general, no son utilizados por los consumidores, por lo tanto, son superiores". Una encuesta de la industria publicada recientemente (todavía estoy en las noticias, estoy seguro), reveló que SATA realmente sobrevive a SAS en promedio, al menos con el tamaño de muestra significativo de la encuesta. (Me sorprendió, eso es seguro.) No puedo recordar si se trataba de versiones "empresariales" de SATA, o de los consumidores, o qué velocidades, pero en mi considerable experiencia, los modelos empresariales y de consumo fallan al mismo tiempo. Tasas estadísticamente significativas. (Sin embargo, existe el problema de que las unidades de consumo tardan demasiado tiempo en fallar, lo que definitivamente es importante en la empresa, pero eso no me ha mordido, y creo que es más relevante para los controladores de hardware que podrían tomar todo volumen fuera de línea en tales casos. Pero eso no es un problema SAS vs SATA, y ZFS nunca me ha fallado. Como resultado de esa experiencia, ahora uso una combinación de 1/3 unidades SATA empresariales y 2/3 de consumo .) Además, no he visto un impacto significativo en el rendimiento con esta mezcla de SATA, cuando se configura correctamente (por ejemplo, una franja de espejos de tres vías), pero nuevamente tengo una baja demanda de IOPS, así que dependiendo de qué tan grande sea su tienda y casos de uso típicos, YMMV. Definitivamente, he notado que el tamaño de caché incorporado por disco es más importante para los problemas de latencia que la velocidad de rotación del plato, en mis casos de uso.
En otras palabras, es un sobre con múltiples parámetros: costo, rendimiento, IOPS, tipo de datos, número de usuarios, ancho de banda administrativo y casos de uso comunes. Decir que SAS es siempre la solución correcta es ignorar un gran universo de permutaciones de esos factores.
Pero de cualquier manera, ZFS es absolutamente genial.