En mi búsqueda interminable para identificar ronquidos, descubrí que la "planitud espectral" parece ser una medida justa de la "calidad" de la señal.
Estoy calculando la planitud espectral como la media geométrica de los puntos de datos de potencia FFT divididos por la media aritmética de los mismos puntos.
Luego (un pequeño giro aquí) estoy calculando la media aritmética y la desviación estándar de la planitud espectral en ejecución (más de 50 cuadros) y calculando una desviación estándar "normalizada" como la desviación estándar en ejecución dividida por la media en ejecución.
Para mis muestras, encuentro que esta métrica es mayor que aproximadamente (rango de hasta o menos) cuando el audio es "bueno" (es decir, tengo un seguimiento confiable de los sonidos de respiración / ronquidos de un sujeto dormido) y generalmente se desliza hacia abajo debajo de cuando el audio está "en el lodo". (Puedo mejorar algo esta discriminación usando un umbral que se mueve con otros factores, pero presumiblemente ese es un tema diferente). También observo que la medida supera cuando hay un ruido de fondo considerable (por ejemplo, alguien entra en la habitación y susurra sobre )0.2 1.0
Entonces, mi pregunta básica es: ¿Hay un nombre (más allá de la "desviación estándar normalizada de la planitud espectral") para lo que estoy midiendo, y ¿alguien puede ofrecer una explicación conceptual de lo que significa "la métrica"?
(He probado una docena de otras métricas para la "calidad" de la señal, y esta parece ser la mejor hasta la fecha).
Agregado: Probablemente debería admitir que no tengo un manejo conceptual particularmente bueno de lo que está midiendo la planitud espectral simple (solo el artículo de Wikipedia ), por lo que se agradecería cualquier explicación adicional.