¿Qué estadística se usa para determinar la presencia de una señal en ruido?

Este es un problema de detector, creo:

Estoy perplejo por lo que parece ser un problema simple. Básicamente, tengo una banda de interés. Si existen energías de señal dentro de esta banda de interés, entonces realizo la operación X en mi señal.

Mi problema es que no estoy seguro exactamente de cómo 'decidir' si existe o no una señal. En eso, después de realizar una FFT, puedo buscar picos.

Pero ahora que?

¿La estadística utilizada generalmente compara este pico con la media circundante del espectro? ¿O es alguna otra estadística?
¿Qué medida estadística utilizo para determinar simplemente si hay una señal e ir desde allí?
¿Cómo configuro este valor? Umbral simple?

EDITAR Basado en comentarios:

Para este caso simple, estoy asumiendo un tono, en ruido gaussiano blanco. Lo que estoy tratando de manejar son:

¿Cómo exactamente se genera una curva ROC ? ¿Hay que ir primero y etiquetar todos los datos, y luego obtener las tasas de verdadero positivo y falso positivo para una multitud de umbrales?
¿Cómo afecta la disminución de la SNR a la curva ROC? ¿Moverlo hacia la diagonal?
¿Qué está haciendo la combinación adaptativa a una curva ROC dada que de otro modo se generó sin un umbral adaptativo?

3a. ¿Cuáles son algunas técnicas comunes de umbral adaptativo que puedo ver que son comunes?

fft signal-detection

— Spacey
fuente

¿Desea un algoritmo por lotes (fuera de línea) o uno secuencial (en línea)? ¿Tiene estadísticas de ruido y señal (es decir, puede caracterizar la razón de probabilidad)? Si es así, ¿ha intentado usar un SPRT ?

— Emre

@Emre Puede estar fuera de línea. No estoy realmente seguro de qué quiere decir con estadísticas de señal / ruido, tengo un sensor que medirá una señal (tono) en presencia de ruido, y su SNR puede variar ...

— Spacey

Quiere decir: ¿cuáles son las propiedades estadísticas del ruido y la señal? ¿Conoces la distribución del ruido? ¿Qué pasa con la distribución de la señal más el ruido?

— Jason R

@JasonR Ya veo. Bueno, la señal será un tono y el ruido es gaussiano. ¿Me estoy perdiendo de algo?

— Spacey

Tal vez. Gaussiano blanco? El punto es que para analizarlo teóricamente, debe asumir algún modelo de probabilidad para el ruido y la señal más el ruido. Según esa respuesta, puedes hacer eso.

— Jason R

Respuestas:

Este es uno de los problemas de procesamiento de señal más antiguos, y es probable que se encuentre una forma simple en una introducción a la teoría de detección. Existen enfoques teóricos y prácticos para resolver este problema, que pueden superponerse o no dependiendo de la aplicación específica.

$P_d$ $P_{fa}$

$P_d$ $P_{fa}$ $P_d = 1$ $P_{fa} = 0$ y llámalo un día. Como es de esperar, no es tan fácil. Hay una compensación inherente entre las dos métricas; Por lo general, si hace algo que mejora uno, observará cierta degradación en el otro.

Un ejemplo simple: si está buscando la presencia de un pulso en un contexto de ruido, puede decidir establecer un umbral en algún lugar por encima del nivel de ruido "típico" y decidir indicar la presencia de la señal de interés si su estadística de detección se rompe por encima del umbral ¿Quieres una probabilidad realmente baja de falsa alarma? Establecer el umbral alto. ¡Pero entonces, la probabilidad de detección podría disminuir significativamente si el umbral elevado es igual o superior al nivel de potencia de señal esperado!

$P_d$ $P_{fa}$

ingrese la descripción de la imagen aquí

Un detector ideal tendría una curva ROC que abraza la parte superior de la trama; es decir, podría proporcionar una detección garantizada para cualquier tasa de falsas alarmas. En realidad, un detector tendrá una característica similar a la trazada anteriormente; aumentar la probabilidad de detección también aumentará la tasa de falsas alarmas y viceversa.

Desde una perspectiva teórica, por lo tanto, este tipo de problemas se reduce a seleccionar un cierto equilibrio entre el rendimiento de detección y la probabilidad de falsa alarma. Cómo se describe matemáticamente ese equilibrio depende de su modelo estadístico para el proceso aleatorio que observa el detector. El modelo generalmente tendrá dos estados o hipótesis:

H_{0} : no signal is present

$H_0: \text{no signal is present}$

H_{1} : signal is present

$H_1: \text{signal is present}$

Típicamente, la estadística que observa el detector tendría una de dos distribuciones, según la cual la hipótesis es cierta. Luego, el detector aplica algún tipo de prueba que se utiliza para determinar la hipótesis verdadera y, por lo tanto, si la señal está presente o no. La distribución de la estadística de detección es una función del modelo de señal que elija según corresponda para su aplicación.

Los modelos de señal comunes son la detección de una señal modulada por amplitud de pulso en un contexto de ruido gaussiano blanco aditivo (AWGN) . Si bien esa descripción es algo específica para las comunicaciones digitales, muchos problemas pueden asignarse a ese o un modelo similar. Específicamente, si está buscando un tono de valor constante localizado en el tiempo en un contexto de AWGN, y el detector observa la magnitud de la señal, esa estadística tendrá una distribución de Rayleigh si no hay tono y una distribución de Rician si está presente.

Una vez que se ha desarrollado un modelo estadístico, se debe especificar la regla de decisión del detector. Esto puede ser tan complicado como desee, según lo que tenga sentido para su aplicación. Idealmente, desearía tomar una decisión que sea óptima en algún sentido, en función de su conocimiento de la distribución del estadístico de detección bajo ambas hipótesis, la probabilidad de que cada hipótesis sea verdadera y el costo relativo de estar equivocado sobre cualquiera de las hipótesis ( de lo que hablaré más en un momento). La teoría de decisión bayesiana se puede utilizar como marco para abordar este aspecto del problema desde una perspectiva teórica.

$T$ $T(t)$ $t$

$T$ $T=5$ $P_d = 0.9999$ $P_{fa} = 0.01$

Donde finalmente decide sentarse en la curva de rendimiento depende de usted, y es un parámetro de diseño importante. El punto de rendimiento adecuado para elegir depende del costo relativo de los dos tipos de posibles fallas: ¿es peor que su detector pierda una ocurrencia de la señal cuando sucede o registrar una ocurrencia de la señal cuando no ha sucedido? Un ejemplo: una capacidad ficticia de detector de misiles balísticos con capacidad de retroceso automático sería mejor para tener una tasa de alarma muy falsa; iniciar una guerra mundial debido a una detección espuria sería desafortunado. Un ejemplo de la situación inversa sería un receptor de comunicación utilizado para aplicaciones de seguridad de la vida; si desea tener la máxima confianza de que no deja de recibir mensajes de socorro,

— Jason R
fuente

Gracias JasonR, muy buena publicación. Todavía estoy digiriendo tu publicación, sin embargo, una pregunta me viene a la mente. ¿Cómo se genera exactamente esta curva ROC? Entiendo que mido la tasa de positivo verdadero y falso positivo para cualquier clasificador, y eso marca un punto en la curva ROC. Entonces, ¿qué se está cambiando de modo que obtenga muchos puntos para poder generar una curva para cualquier clasificador?

— Spacey

P_{d}

$P_d$

P_{f a}

$P_{fa}$

La estadística es la razón de probabilidad (LR), y la prueba es la comparación de la LR con un umbral. Si sigue la tradición de colocar la probabilidad de la hipótesis nula en el denominador, decide a favor de la hipótesis alternativa (en contra de la hipótesis nula ) si la LR es suficientemente alta. Cuanto mayor sea la relación, mayor será su confianza. Esta es la prueba que realizaría si ya ha recopilado los datos. Si desea decidir a medida que los datos llegan poco a poco, puede usar una prueba secuencial , como SPRT .

En esta etapa, podría beneficiarse de un libro sobre pruebas de hipótesis o teoría de decisiones (más general).

— Emre
fuente