¿Cómo soluciono los problemas de congelaciones aleatorias, donde el sistema no acepta ninguna entrada?
Tengo una computadora que solía ejecutar Ubuntu hace unos años sin ningún problema (no sé si algún hardware ha cambiado). Recientemente, no importa qué distribución de Linux instale, se congelará aleatoriamente hasta un punto donde el cursor esté congelado y no responda a ninguna entrada de teclado, incluyendo alt + sysrq (cuando el sistema no está congelado, puedo alt + sysrq REISUB y se reiniciará). No hay respuestas en ¿Qué debo hacer cuando Ubuntu se congela? que parecen "funcionar" en esta situación.
He activado la congelación con los siguientes sistemas: Ubuntu 12.04, Ubuntu 14.04, Ubuntu 14.10, Ubuntu 15.04, Ubuntu 15.10, así como Fedora 22 y 23 (todas las versiones de 64 bits). Sucede con XFCE, Unity e incluso Gnome, sucede con nouveau y diferentes versiones del controlador propietario de nvidia. Puede congelarse incluso durante la instalación o durante una sesión en vivo. Algunas veces el sistema funcionará durante 5 minutos antes de congelarse y otras dos horas. El mismo hardware puede ejecutar un sistema operativo Windows durante días sin problemas.
He intentado configurar Kernel Crash Dump, pero no parece activarse cuando el sistema se congela. No hay entradas en syslog o kern.log que parecen haber sido escritas justo antes del congelamiento. En algunos bloqueos, la última entrada en syslog o kern.log fue 30 minutos antes.
Actualización: he desconectado una tarjeta de red inalámbrica, así como una cámara web USB, dejaré que la máquina funcione durante la noche para ver si una de ellas la está causando. Se actualizará con los resultados.
Actualización 2: se congeló de nuevo. Estoy literalmente sin ideas. Cualquier sugerencia es bienvenida.
Actualización 3: Algunas especificaciones de hardware que pueden ser relevantes:
Placa base: Sabertooth 990FX R2.0
CPU: AMD FX-8350 Black Edition
GPU: GeForce GTX 660
Actualización3:
Recientemente he actualizado la BIOS del Sabertooth 990FX R2.0 a la Versión 2501 (la última versión disponible actualmente), sin suerte.
Actualización 4:
He realizado una prueba de memoria durante 9 horas, varias pasadas y ni un solo error. Hay dos DIMMS asentados en las ranuras 2 y 4 de la placa base. Ahora he intentado eliminar el de la ranura 4 y veré si puedo reproducir el congelamiento. Los cambiará después.
Actualización 5:
Ha funcionado durante muchas horas sin congelarse hasta ahora, me resulta difícil creerme. Podría resolverse, pero no entiendo por qué. Supongo que intentaré darle unos días para estar seguro.
Actualización 6:
No ha habido congelamientos, y debo concluir que fueron causados por una memoria defectuosa. Dado que el memtest no mostró ningún error, es probable que nunca hubiera descubierto qué estaba mal si no hubiera comenzado a desconectar partes 'aleatorias'. ¿Es este el mejor enfoque realmente? Si alguien puede escribir una forma más sistemática de hacer algo como esto, tal vez con la solución de problemas desde Ubuntu, les otorgaré la recompensa.