Cómo aplicar el teorema de Bayes a la búsqueda de un pescador perdido en el mar

19

El artículo The Odds, continuamente actualizado menciona la historia de un pescador de Long Island que literalmente debe su vida a las estadísticas bayesianas. Aquí está la versión corta:

Hay dos pescadores en un bote en medio de la noche. Mientras uno está dormido, el otro cae al océano. El bote continúa navegando en piloto automático durante toda la noche hasta que el primer hombre finalmente se despierta y notifica a la Guardia Costera. La Guardia Costera utiliza un software llamado SAROPS (Sistema de Planificación Óptima de Búsqueda y Rescate) para encontrarlo justo a tiempo, ya que estaba hipotérmico y casi sin energía para mantenerse a flote.

Aquí está la versión larga: A Speck In The Sea

Quería saber más sobre cómo el Teorema de Bayes se aplica realmente aquí. Descubrí bastante sobre el software SAROPS simplemente buscando en Google.

El simulador de SAROPS

El componente del simulador tiene en cuenta datos oportunos como la corriente oceánica, el viento, etc. y simula miles de posibles rutas de deriva. A partir de esos caminos de deriva, se crea un mapa de distribución de probabilidad.

Tenga en cuenta que los siguientes gráficos no se refieren al caso del pescador desaparecido que mencioné anteriormente, pero son un ejemplo de juguete tomado de esta presentación

Mapa de probabilidad 1 (el rojo indica la probabilidad más alta; el azul, la más baja) ingrese la descripción de la imagen aquí

Tenga en cuenta el círculo que es la ubicación inicial.

Mapa de probabilidad 2 : ha pasado más tiempo ingrese la descripción de la imagen aquí

Tenga en cuenta que el mapa de probabilidad se ha convertido en multimodal. Esto se debe a que en este ejemplo, se tienen en cuenta múltiples escenarios:

La persona está flotando en el agua - modo superior-medio
La persona está en una balsa salvavidas (más afectada por el viento del norte) - modos 2 inferiores (divididos debido a "efectos de vibración")

Mapa de probabilidad 3 : la búsqueda se realizó a lo largo de las rutas rectangulares en rojo ingrese la descripción de la imagen aquí Esta imagen muestra las rutas óptimas producidas por el planificador (otro componente de SAROPS). Como puede ver, se buscaron esas rutas y el simulador actualizó el mapa de probabilidad.

Tal vez se pregunte por qué las áreas que se han buscado no se han reducido a una probabilidad cero. Eso es porque hay una probabilidad de falla, , factorizada, es decir, hay una posibilidad no despreciable de que el buscador pase por alto a la persona en el agua. Es comprensible que la probabilidad de falla sea mucho mayor para una persona solitaria a flote que para una persona en una balsa salvavidas (más fácil de ver), por lo que las probabilidades en el área superior no disminuyeron demasiado. $p(\text{fail})$

Efectos de una búsqueda fallida

Aquí es donde entra en juego el Teorema de Bayes. Una vez que se realiza una búsqueda, el mapa de probabilidad se actualiza en consecuencia para que otra búsqueda se pueda planificar de manera óptima.

Después de revisar el Teorema de Bayes en Wikipedia y en el artículo Una explicación intuitiva (y breve) del Teorema de Bayes en BetterExplained.com

Tomé la ecuación de Bayes:

PAG (UN ∣ X) = \frac{PAG (X ∣ UN) \times PAG (UN)}{PAG (X)}

$P(\text{A}\mid\text{X}) = \frac{P(\text{X}\mid\text{A}) \times P(\text{A})}{P(\text{X})}$

Y definió A y X de la siguiente manera ...

Evento A: la persona está en esta área (celda de cuadrícula)
Prueba X: búsqueda fallida en esa área (celda de cuadrícula), es decir, busqué esa área y no vi nada

Flexible,

PAG (persona allí ∣ fracasado) = \frac{PAG (fracasado ∣ persona allí) \times PAG (persona allí)}{PAG (fracasado)}

$P(\text{person there}\mid\text{unsuccessful}) = \frac{P(\text{unsuccessful}\mid\text{person there}) \times P(\text{person there})}{P(\text{unsuccessful})}$

En el Sistema de Planificación Óptima de Búsqueda y Rescate descubrí que SAROPS calcula la probabilidad de una búsqueda fallida, , teniendo en cuenta las rutas de búsqueda y las rutas de deriva simuladas. Entonces, por simplicidad, supongamos que sabemos cuál es el valor de . $P(\text{fail})$ $P(\text{fail})$

Entonces ahora tenemos,

PAG (persona allí ∣ fracasado) = \frac{PAG (fallar) \times PAG (persona allí)}{PAG (fracasado)}

$P(\text{person there}\mid\text{unsuccessful}) = \frac{P(\text{fail}) \times P(\text{person there})}{P(\text{unsuccessful})}$

¿La ecuación de Bayes se aplica correctamente aquí?
¿Cómo se calcularía el denominador, la probabilidad de una búsqueda fallida?

También en el sistema de planificación óptima de búsqueda y rescate , dicen

Las probabilidades previas se "normalizan en la forma bayesiana habitual" para producir las probabilidades posteriores
¿Qué significa "normalizado en la forma bayesiana normal" ?

¿Significa que todas las probabilidades se dividen por , o simplemente se normalizan para garantizar que todo el mapa de probabilidad se sume a uno? ¿O son estos uno y lo mismo? $P(\text{unsuccessful})$
Por último, ¿cuál sería la forma correcta de normalizar el mapa de probabilidad cuadriculado después de haber actualizado para una búsqueda fallida, teniendo en cuenta que dado que no ha buscado TODAS las áreas (celdas de la cuadrícula) tendría algunas celdas iguales a y algunos iguales a ? $P(\text{person there})$ $P(\text{person there}\mid\text{unsuccessful})$

Otra nota de simplificación: de acuerdo con el Sistema de Planificación Óptima de Búsqueda y Rescate, la distribución posterior se calcula realmente actualizando las probabilidades de las rutas de deriva simuladas y ENTONCES volviendo a generar el mapa de probabilidad cuadriculado. Para mantener este ejemplo lo suficientemente simple, elegí ignorar las rutas de simulación y centrarme en las celdas de la cuadrícula.

— mlai
fuente

6

Suponiendo independencia entre las celdas de la cuadrícula, entonces sí, parece que el Teorema de Bayes se ha aplicado correctamente.
El denominador puede expandirse, p. Ej. usando la ley de probabilidad total donde es el complemento de , es decir, la persona no está allí. Probablemente asumirías . $PAG (X) = PAG (X El | UN) PAG (UN) + PAG (X El | {UN}^{C}) PAG ({UN}^{C})$ $P(X) = P(X|A)P(A) + P(X|A^c)P(A^c)$ $A^c$ $A$ $P(X|A^c)=1$
No estoy seguro de lo que significa "normalizado en la forma bayesiana normal", ya que no escribí el manual. Pero ciertamente están hablando del hecho de que las siguientes tres ecuaciones son suficientes para encontrar : Para que nunca tenga que calcular , es decir, la constante de normalización. No sé si usaron esto para actualizar la probabilidad de una celda de cuadrícula única o de todo el mapa (probablemente ambas). $P(A|X)$ $PAG (UN El | X) \propto PAG (X El | UN) PAG (UN) PAG ({UN}^{C} El | X), \propto PAG (X El | {UN}^{C}) PAG ({UN}^{C}), y PAG (UN El | X) + PAG ({UN}^{C} El | X) = 1$ $P(A|X) \propto P(X|A)P(A)\quad P(A^c|X), \propto P(X|A^c)P(A^c), \mbox{ and } P(A|X)+P(A^c|X) = 1$ $P(X)$
Vamos a ampliar la notación tener celda de la cuadrícula y ser el caso de que el individuo se encuentra en la celda de cuadrícula y ser el caso de que la celda de cuadrícula fue registrado y se encontró a nadie. Con la nueva notación, será la colección de búsquedas que fallaron. Asumimos lo siguiente: $i$ $A_i$ $i$ $X_i$ $i$ $X$
- $\sum_i P(A_i|X)=1$ , es decir, después de realizar búsquedas, las células totales suma de la probabilidad de que el individuo está en esa celda es 1. Esta es la ley total de probabilidad de nuevo.
- Si suponemos que la búsqueda en una celda no nos dice nada sobre ninguna otra celda, entonces las celdas que se buscaron y para celdas que no se buscaron . Si no asumimos la independencia, las fórmulas serán más complicadas pero la intuición será similar, es decir, calcular hasta una constante de proporcionalidad. $P(A_i|X) = P(A_i|X_i)\propto P(X_i|A_i)P(A_i)$ $P(A_i|X) \propto P(A_i)$ $P(A_i|X)$
Podemos usar estos dos supuestos para calcular y actualizar el mapa en consecuencia. $P(A_i|X)$

— jaradniemi
fuente

Gracias por las excelentes respuestas;) Entonces, suponiendo la independencia de la celda de la cuadrícula y , después de buscar en cada celda una vez, sería válido calcular para cada celda y luego dividir cada celda por la suma de todas las celdas ( ) para normalizar?

\sum_{i} P (A_{i} | X) = 1

$\sum_{i}P(A_i|X)=1$

P (X | A) P (A)

$P(X|A)P(A)$

\sum_{i} P (X | A) P (A_{i})

$\sum_{i}P(X|A)P(A_i)$

— mlai

Me acabo de dar cuenta de que buscar en cada celda con una probabilidad fija de falla no produciría absolutamente ningún cambio entre la distribución de probabilidad :)

— mlai

Entonces, para reformular ... Suponiendo la ley de probabilidad total (como en su respuesta a 4.), después de buscar algunas (pero no todas) de las celdas, ¿podríamos normalizar dividiendo cada celda por la suma de todas las celdas? ... usando para el valor de las celdas que se han buscado y para las que no.

P (X | A) P (A_{i})

$P(X|A)P(A_i)$

P (A_{i})

$P(A_i)$

— mlai

4

Me señaló un libro que tiene un capítulo entero dedicado a mi pregunta, Análisis de operaciones navales , de un ex profesor que solía ser piloto de helicóptero y que en realidad realizó misiones de búsqueda y rescate, ¡nada menos!

En el capítulo 8 se proporciona un ejemplo similar a este (lo personalicé un poco):

Para empezar, hay una distribución previa cuadriculada para la ubicación de la (s) persona (s) desaparecida (s), barco, etc.

Distribución previa:

Se realiza una búsqueda en parte de la cuadrícula y las probabilidades se actualizan con una distribución posterior normalizada aplicando la ecuación de Bayes de la misma manera que mencioné en mis preguntas:

PAG (objetivo en (i, j) ∣ sin detectar) = \frac{PAG (sin detectar ∣ objetivo en (i, j)) \times PAG (objetivo en (i, j))}{PAG (sin detectar)}

$P(\text{target in (i,j)}\mid\text{no detection}) = \frac{P(\text{no detection}\mid\text{target in (i,j)}) \times P(\text{target in (i,j)})}{P(\text{no detection})}$

donde (i, j) = (lat, largo)

En este caso, decidí buscar la columna 3 porque esa columna tenía la mayor probabilidad previa total .

Distribución posterior normalizada después de buscar la tercera columna con pFail = 0.2:

Mi pregunta fue principalmente sobre cómo se normalizó la parte posterior. Así es como se hizo en el libro: simplemente divida cada probabilidad posterior individual por la suma total , S :

descripción de la imagen

Elegí una probabilidad de 0.2 de una búsqueda fallida porque mi profesor dijo lo siguiente: "Solo buscamos una probabilidad de detección del 80% porque esa suele ser la mejor compensación entre timidez y precisión".

Solo por diversión, ejecuté otro ejemplo con un pFail de 0.5. Mientras que en el primer ejemplo ( pFail = 0.2), la siguiente mejor ruta de búsqueda (dada la búsqueda normalizada posterior y en línea recta, sin diagonal o zig-zag) sería volar sobre la columna 2, en el segundo ejemplo ( pFail = 0.5) la siguiente mejor ruta es sobre la fila 2.

Distribución posterior normalizada después de buscar la tercera columna con pFail = 0.5:

ingrese la descripción de la imagen aquí

También agregó esto: "Las aeronaves llevan una pequeña lista de verificación con ellas para ayudar a determinar la mejor altitud y velocidad aérea. Trabajar esto en un helicóptero volador es como sentarse sobre una lavadora, leer un libro que está pegado a una lavadora diferente".

— mlai
fuente