El artículo The Odds, continuamente actualizado menciona la historia de un pescador de Long Island que literalmente debe su vida a las estadísticas bayesianas. Aquí está la versión corta:
Hay dos pescadores en un bote en medio de la noche. Mientras uno está dormido, el otro cae al océano. El bote continúa navegando en piloto automático durante toda la noche hasta que el primer hombre finalmente se despierta y notifica a la Guardia Costera. La Guardia Costera utiliza un software llamado SAROPS (Sistema de Planificación Óptima de Búsqueda y Rescate) para encontrarlo justo a tiempo, ya que estaba hipotérmico y casi sin energía para mantenerse a flote.
Aquí está la versión larga: A Speck In The Sea
Quería saber más sobre cómo el Teorema de Bayes se aplica realmente aquí. Descubrí bastante sobre el software SAROPS simplemente buscando en Google.
El simulador de SAROPS
El componente del simulador tiene en cuenta datos oportunos como la corriente oceánica, el viento, etc. y simula miles de posibles rutas de deriva. A partir de esos caminos de deriva, se crea un mapa de distribución de probabilidad.
Tenga en cuenta que los siguientes gráficos no se refieren al caso del pescador desaparecido que mencioné anteriormente, pero son un ejemplo de juguete tomado de esta presentación
Mapa de probabilidad 1 (el rojo indica la probabilidad más alta; el azul, la más baja)
Tenga en cuenta el círculo que es la ubicación inicial.
Mapa de probabilidad 2 : ha pasado más tiempo
Tenga en cuenta que el mapa de probabilidad se ha convertido en multimodal. Esto se debe a que en este ejemplo, se tienen en cuenta múltiples escenarios:
- La persona está flotando en el agua - modo superior-medio
- La persona está en una balsa salvavidas (más afectada por el viento del norte) - modos 2 inferiores (divididos debido a "efectos de vibración")
Mapa de probabilidad 3 : la búsqueda se realizó a lo largo de las rutas rectangulares en rojo Esta imagen muestra las rutas óptimas producidas por el planificador (otro componente de SAROPS). Como puede ver, se buscaron esas rutas y el simulador actualizó el mapa de probabilidad.
Tal vez se pregunte por qué las áreas que se han buscado no se han reducido a una probabilidad cero. Eso es porque hay una probabilidad de falla, , factorizada, es decir, hay una posibilidad no despreciable de que el buscador pase por alto a la persona en el agua. Es comprensible que la probabilidad de falla sea mucho mayor para una persona solitaria a flote que para una persona en una balsa salvavidas (más fácil de ver), por lo que las probabilidades en el área superior no disminuyeron demasiado.
Efectos de una búsqueda fallida
Aquí es donde entra en juego el Teorema de Bayes. Una vez que se realiza una búsqueda, el mapa de probabilidad se actualiza en consecuencia para que otra búsqueda se pueda planificar de manera óptima.
Después de revisar el Teorema de Bayes en Wikipedia y en el artículo Una explicación intuitiva (y breve) del Teorema de Bayes en BetterExplained.com
Tomé la ecuación de Bayes:
Y definió A y X de la siguiente manera ...
Evento A: la persona está en esta área (celda de cuadrícula)
Prueba X: búsqueda fallida en esa área (celda de cuadrícula), es decir, busqué esa área y no vi nada
Flexible,
En el Sistema de Planificación Óptima de Búsqueda y Rescate descubrí que SAROPS calcula la probabilidad de una búsqueda fallida, , teniendo en cuenta las rutas de búsqueda y las rutas de deriva simuladas. Entonces, por simplicidad, supongamos que sabemos cuál es el valor de .
Entonces ahora tenemos,
¿La ecuación de Bayes se aplica correctamente aquí?
¿Cómo se calcularía el denominador, la probabilidad de una búsqueda fallida?
También en el sistema de planificación óptima de búsqueda y rescate , dicen
Las probabilidades previas se "normalizan en la forma bayesiana habitual" para producir las probabilidades posteriores
¿Qué significa "normalizado en la forma bayesiana normal" ?
¿Significa que todas las probabilidades se dividen por , o simplemente se normalizan para garantizar que todo el mapa de probabilidad se sume a uno? ¿O son estos uno y lo mismo?
Por último, ¿cuál sería la forma correcta de normalizar el mapa de probabilidad cuadriculado después de haber actualizado para una búsqueda fallida, teniendo en cuenta que dado que no ha buscado TODAS las áreas (celdas de la cuadrícula) tendría algunas celdas iguales a y algunos iguales a ?
Otra nota de simplificación: de acuerdo con el Sistema de Planificación Óptima de Búsqueda y Rescate, la distribución posterior se calcula realmente actualizando las probabilidades de las rutas de deriva simuladas y ENTONCES volviendo a generar el mapa de probabilidad cuadriculado. Para mantener este ejemplo lo suficientemente simple, elegí ignorar las rutas de simulación y centrarme en las celdas de la cuadrícula.