Donde trabajo tenemos numerosos servidores de "gran hierro" que se utilizan para alojar muchas máquinas virtuales con un hipervisor Xen. Por lo general, se configuran con 32 GB de RAM, procesos de doble núcleo cuádruple y discos rápidos con una gran capacidad de E / S.
Estamos en el momento en que la configuración de hardware existente se está volviendo un poco larga y es hora de salir y buscar hardware nuevo más grande, más rápido y más brillante.
Como se mencionó anteriormente, el kit existente se ha implementado con 32 GB de RAM y eso ha limitado de manera efectiva la cantidad de máquinas virtuales que podemos implementar en un host.
Sin embargo, al investigar el hardware más nuevo, es evidente que puede obtener más RAM en una sola máquina con 64, 72 o incluso 96 GB en un solo chasis. Evidentemente, esto nos permitirá llevar más máquinas a un host determinado, lo que siempre es una victoria. El análisis completado hasta ahora sugiere que el factor limitante ahora se trasladará al subsistema de disco.
El problema ahora es tratar de tener una idea de dónde estamos ... En virtud del uso, sabemos que no estamos limitados en términos de ancho de banda de E / S, más aún, el número de I aleatorios / O operaciones que pueden completarse. Sabemos anecdóticamente que una vez que lleguemos a este punto, entonces iowait se disparará y todo el rendimiento de la máquina se destinará a los perros.
Ahora, este es el meollo de la pregunta que estoy haciendo. ¿Alguien sabe de una manera precisa de rastrear / marcar con precisión el rendimiento de E / S existente específicamente en relación con el número de operaciones de E / S aleatorias que se están completando?
En lo que realmente estoy tratando de obtener una métrica es "esta configuración puede manejar con éxito X número de solicitudes de E / S aleatorias, y actualmente (en promedio) estamos haciendo operaciones Y con un pico de operaciones Z".
¡Gracias por adelantado!