No es una pregunta técnica, pero sí válida. Guión:
HP ProLiant DL380 Gen 8 con 2 CPU Xeon E5-2667 de 8 núcleos y 256 GB de RAM con ESXi 5.5. Ocho máquinas virtuales para un sistema de proveedor determinado. Cuatro máquinas virtuales para prueba, cuatro máquinas virtuales para producción. Los cuatro servidores en cada entorno realizan diferentes funciones, por ejemplo: servidor web, servidor de aplicaciones principal, servidor OLAP DB y servidor SQL DB.
Los recursos compartidos de la CPU configurados para evitar que el entorno de prueba afecte la producción. Todo el almacenamiento en SAN.
Hemos tenido algunas consultas sobre el rendimiento, y el proveedor insiste en que debemos darle al sistema de producción más memoria y vCPU. Sin embargo, podemos ver claramente desde vCenter que las asignaciones existentes no se están tocando, por ejemplo: una vista mensual de la utilización de la CPU en el servidor de aplicaciones principal oscila alrededor del 8%, con un pico impar de hasta el 30%. Los picos tienden a coincidir con el inicio del software de respaldo.
Historia similar en RAM: la cifra de utilización más alta en los servidores es de ~ 35%.
Por lo tanto, hemos estado cavando un poco, usando Process Monitor (Microsoft SysInternals) y Wireshark, y nuestra recomendación al proveedor es que hagan algunos ajustes de TNS en primera instancia. Sin embargo, esto está fuera del punto.
Mi pregunta es: ¿cómo podemos hacer que reconozcan que las estadísticas de VMware que les hemos enviado son evidencia suficiente de que más RAM / vCPU no ayudará?
--- ACTUALIZACIÓN 07/12/2014 ---
Semana interesante Nuestra administración de TI ha dicho que deberíamos hacer el cambio en las asignaciones de VM, y ahora estamos esperando un tiempo de inactividad de los usuarios comerciales. Curiosamente, los usuarios de negocios son los que dicen que ciertos aspectos de la aplicación se ejecutan lentamente (en comparación con lo que, no sé), pero van a "avisarnos" cuando podamos desactivar el sistema (refunfuñar) , gruñir!)
Además, el aspecto "lento" del sistema aparentemente no es el elemento HTTP (S), es decir, la "aplicación delgada" utilizada por la mayoría de los usuarios. Parece que son las instalaciones del "cliente gordo", utilizadas por los principales organismos financieros, lo que aparentemente es "lento". Esto significa que ahora estamos considerando la interacción del cliente y el cliente-servidor en nuestras investigaciones.
Como el propósito inicial de la pregunta era buscar ayuda sobre si seguir la ruta de "empujarlo", o simplemente hacer el cambio, y ahora estamos haciendo el cambio, lo cerraré usando la respuesta de longneck .
Gracias por su aportación a todos ustedes; como de costumbre, serverfault ha sido más que un simple foro: también es como el sofá de un psicólogo :-)