Debo aclarar inmediatamente que soy un desarrollador de software práctica, no un estadístico, y que clase de mi universidad estadísticas era un muy largo tiempo atrás ...
Dicho esto, me gustaría saber si hay un método para acumular un conjunto de estadísticas descriptivas que luego podrían usarse para producir un diagrama de caja, que no implica almacenar un montón de muestras individuales.
Lo que intento hacer es producir un resumen gráfico de los tiempos de servicio de la cola dentro de un complejo proceso de múltiples colas. En el pasado, utilicé un paquete llamado tnftools que permitía acumular muestras grandes y luego procesarlas en un buen gráfico de tiempos de respuesta y valores atípicos ... Pero tnftools no está disponible para mi plataforma actual.
Idealmente, me gustaría poder acumular un conjunto de estadísticas descriptivas "sobre la marcha" a medida que se ejecuta el proceso, y luego extraer los datos para el análisis a pedido. Pero no puedo simplemente hacer que el proceso acumule muestras, ya que la memoria / IO involucrada en hacerlo tendría un impacto inaceptable en el rendimiento del sistema.