Durante un tiempo, he estado tratando de entender por qué algunos de nuestros sistemas críticos para el negocio están recibiendo informes de "lentitud" que van de leves a extremos. Recientemente he dirigido mi atención al entorno VMware donde están alojados todos los servidores en cuestión.
Recientemente descargué e instalé la versión de prueba del paquete de administración Veeam VMware para SCOM 2012, pero me cuesta creer (y también mi jefe) los números que me informa. Para tratar de convencer a mi jefe de que los números que me dice son ciertos, comencé a buscar en el cliente VMware para verificar los resultados.
He mirado este artículo de VMware KB ; específicamente para la definición de Co-Stop que se define como:
Cantidad de tiempo que una máquina virtual MP estaba lista para ejecutarse, pero sufrió un retraso debido a la contención de programación de co-vCPU
A lo que estoy traduciendo
El sistema operativo invitado necesita tiempo del host, pero tiene que esperar a que los recursos estén disponibles y, por lo tanto, puede considerarse "que no responde"
¿Esta traducción parece correcta?
Si es así, aquí es donde me cuesta creer lo que estoy viendo: ¡el host que contiene la mayoría de las máquinas virtuales que son "lentas" muestra actualmente un promedio de CPU Co-stop promedio de 127,835.94 milisegundos!
¿Significa esto que, en promedio, las máquinas virtuales en este host tienen que esperar más de 2 minutos para el tiempo de CPU?
Este host tiene dos CPU de 4 núcleos y tiene un invitado de CPU 1x8 y invitados de CPU 14x4.