Tengo un servidor Netware 3.12 de la era de 1998 que ejecuta todo en nuestro campus: libro mayor, compras, nómina, información de estudiantes, calificaciones, lo que sea. El servidor tiene un controlador RAID Adaptec con dos volúmenes:
- RAID 1, 2 discos scsi de 17 GB, Seagate ST318417W
- RAID 5, 3 discos scsi de 4 GB, 2 Seagate ST34573W y 1 ST34572W.
Actualmente estamos en las primeras etapas de un proyecto para reemplazar este sistema, pero no solo te lanzas a un nuevo sistema como ese, así que necesito mantener este servidor en funcionamiento hasta al menos noviembre de 2011.
Esta semana no tuvimos uno sino dos discos duros que fallaron. Afortunadamente, son de diferentes volúmenes y podemos seguir funcionando por el momento, pero dada la naturaleza cercana de estas fallas, tengo serias dudas de que podré evitar fallas catastróficas de este servidor hasta el objetivo de noviembre como está sin Restauración de la redundancia RAID: solo se necesitará una falla de unidad más en cualquier lugar y estoy completamente manguera.
Somos lo suficientemente afortunados de tener "repuestos" de coincidencia exacta en ambas unidades, pero los repuestos están en condiciones desconocidas. Intenté intercambiar solo ellos, pero el controlador RAID no es lo suficientemente inteligente como para manejar esto y hace que el sistema no se pueda arrancar.
En cuanto al controlador RAID en sí, hay una utilidad en la que puedo acceder durante la POST a través de un atajo Ctrl-A, pero no puedo hacer mucho desde allí. Para administrar realmente los volúmenes, primero debo iniciar en Netware, momento en el cual puedo usar CI/O Array Management Software Version 2.0
para ver la información del volumen. Sospecho que la forma normal de administrar las cosas es arrancar desde un disquete especial con el software del controlador, pero ese disquete ya no existe.
Revisando las opciones en el software RAID, creo que la única forma compatible de reemplazar un disco en un volumen RAID existente es agregar físicamente el disco, arrancarlo y configurarlo como "repuesto" para un volumen, forzar el uso del volumen el repuesto para reemplazar un disco inactivo existente (y en este punto solo estoy adivinando) para que el disco inactivo se convierta en repuesto, repare el volumen, retire el repuesto del volumen y luego apague y retire el disco. Luego, comience de nuevo para el otro disco fallido. Todo esto equivale a mucho tiempo de inactividad, suponiendo que incluso pueda hacerlo funcionar y que mis repuestos sean buenos.
En cuanto a la búsqueda de repuestos confiables, no tengo idea de dónde comenzar a buscar un nuevo disco scsi de 4GB, o incluso qué sistema scsi exacto estoy buscando, ya que ha pasado por varias iteraciones diferentes con el tiempo.
Otra opción es migrar esto a una máquina virtual (hyper-v), pero todos los intentos anteriores que hemos realizado en esta área no han podido llegar muy lejos. Cuando se instaló esta máquina, recién me estaba graduando de la escuela secundaria, por lo que requiere un conocimiento de nivel inferior de netware y dos que he desarrollado, o si lo olvidé desde entonces (tampoco soy exactamente un dos neófito).
Parte de mi problema es que este es un servidor de alto uso, y desmontarlo durante unos días para resolver las cosas no funcionará muy bien.
En cuanto a la pregunta, estoy buscando cualquier cosa que pueda ser útil en esta situación: una recomendación sobre un lugar para encontrar buenos repuestos de esta época, experiencia personal reparando volúmenes RAID usando un controlador similar o construyendo un vm hyper-vm desde un viejo servidor de software, una línea en un disquete con un mejor software para el controlador RAID, recomendación sobre un buen consultor de Novell en Nebraska que sería capaz de arreglar las cosas, otra opción que aún no he considerado, etc.
Actualización:
para las copias de seguridad, solo tenemos copias de seguridad buenas (verificadas recientemente mediante restauración) de los datos , nada para el software que realmente ejecuta las cosas.
Actualización 2:
solo un informe de progreso de que actualmente tengo una instalación de Netware 3.12 en funcionamiento en VMWare Virtual Server 2.0, gracias en gran medida a la guía que encontré aquí:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312 -on-vmware.html
Los siguientes pasos son preparar volúmenes de software vacíos para que coincidan con los volúmenes adicionales en mi servidor existente, volcar todo en la unidad C: \ y los volúmenes de software en mi servidor existente, y descubrir a partir de esa información qué módulos necesitan agregarse al software, instalando mis licencias (todavía tenemos ese disco, si es bueno) y moviendo los datos.
Tengo aprobación para apagar el servidor durante una semana después del primero del año (lamentablemente no antes), por lo que, además de crear volúmenes vacíos, el resto del trabajo tendrá que esperar hasta entonces.
Actualización final (5 de enero de 2011):
pude obtener repuestos trabajando en ambas matrices de incursiones sin pérdida de datos esta semana. El controlador enumera ambos ahora como "TOLLERANTE DE FALLOS" (¡sí!). También pude construir sobre el progreso de mi última actualización y ahora tengo un servidor "de repuesto" funcional en VMWare Server 2.0. El repuesto puede ejecutarse y usar nuestro software erp, pero no puedo ponerlo en producción porque (todavía) no puedo imprimir desde esa caja (y no tengo idea de por qué). Aun así, esta máquina virtual funcionará en caso de que no tenga otra opción, y entre ella y los arreglos RAID reparados, me siento cómodo viviendo con la situación hasta que pueda desechar la máquina en noviembre.
Epílogo (16 de enero de 2012):
El proyecto para reemplazar este servidor con un sistema completamente nuevo se puso en marcha según lo planeado. ¡Hurra por no más cubiertos! Todos saluden Servidor SQL! El rey esta muerto. ¡Larga vida al rey!
Todavía planeamos mantener el antiguo servidor funcionando durante un tiempo más, hasta después de que finalice nuestra auditoría posterior al año fiscal en agosto. Pero si ocurre una falla entre ahora y entonces, nadie se quejaría demasiado.