Errores de hardware de la CPU en Ubuntu 17.04


12

¿Alguien puede explicarme qué mensajes de error recibí cuando busqué en dmesg? Soy nuevo en Ubuntu y en el mundo de Linux.

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

Estoy ejecutando Ubuntu 17.04 con 4.10.0-29-kernal genérico


o es un error de software. Tengo lo mismo en mi registro de un nuevo Lenovo T480S, vea bugs.launchpad.net/ubuntu/+source/linux/+bug/1781924
Rolf Schumacher

Respuestas:


8

La CPU se está sobrecalentando y entra en MCE (eventos de verificación de la máquina) ... es decir, se está bloqueando. Si no ve otros eventos relacionados con la temperatura en syslog, probablemente sea porque su enfriador de CPU / ventilador / tubería térmica / pasta térmica no está haciendo el trabajo.

  • Compruebe syslog con este terminalcomando ...

    grep -i -e temp -e therm /var/log/syslog*
    
  • Si la máquina está muy sucia / polvorienta, eso podría desempeñar un papel importante en el sobrecalentamiento de la máquina. Limpiarlo

  • Si su máquina tiene procesadores Intel, asegúrese de que intel-microcodeesté instalada.

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • Instalar thermaldpara probar y controlar la temperatura.

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • Verifique la versión de su BIOS. Ingrese su BIOS al momento del encendido y anote la versión #. Vaya al sitio web del fabricante con la marca / modelo de su computadora. Vaya a la sección de soporte / descargas y vea si hay un BIOS más nuevo.

  • Por último, y muy probablemente, si se trata de una máquina más antigua, el compuesto térmico que se encuentra entre los procesadores y su tubo de calor / enfriador de ventilador debe volver a aplicarse. Esto requiere algo de experiencia técnica.


1
¿Qué impacto intel-micorocodetiene en la temperatura?
gene_wood

@gene_wood como mencioné, probablemente sea un problema de polvo, ventilador o compuesto térmico, y verificar el microcódigo es solo otro paso para ayudar a diagnosticar el problema de forma remota. La CPU que ejecuta un microcódigo antiguo puede causar varios problemas. Segundos para comprobarlo.
heynnema
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.