La respuesta breve a su pregunta es: "la mayoría de las veces no sabemos qué es P (queso) y, a menudo, es (relativamente) difícil de calcular".
La respuesta más larga por la cual la Regla / Teorema de Bayes se expresa normalmente en la forma en que usted escribió es porque en los problemas bayesianos tenemos, sentado en nuestro regazo, una distribución previa (la P (B) arriba) y la probabilidad (la P (A | B), P (A | notB) anterior) y es una cuestión relativamente simple de multiplicación calcular el posterior (P (B | A)). Ir a la molestia de volver a expresar P (A) en su forma resumida es un esfuerzo que podría gastarse en otro lugar.
Puede que no parezca tan complicado en el contexto de un correo electrónico porque, como has señalado correctamente, es solo P (queso), ¿verdad? El problema es que con problemas Bayesianos más involucrados en el campo de batalla, el denominador es una integral desagradable, que puede o no tener una solución de forma cerrada. De hecho, a veces necesitamos métodos sofisticados de Montecarlo solo para aproximar la integral y la agitación de los números puede ser un verdadero dolor en la parte trasera.
Pero más al punto, por lo general, ni siquiera nos importa qué es P (queso). Tenga en cuenta que estamos tratando de perfeccionar nuestra creencia sobre si un correo electrónico es spam o no , y no podría importarnos menos la distribución marginal de los datos (la P (A), arriba). Es solo una constante de normalización, de todos modos, que no depende del parámetro; el acto de suma elimina cualquier información que tengamos sobre el parámetro. La constante es una molestia para calcular y, en última instancia, es irrelevante cuando se trata de concentrarse en nuestras creencias sobre si el correo electrónico no deseado es o no. A veces estamos obligados a calcularlo, en cuyo caso la forma más rápida de hacerlo es con la información que ya tenemos: el previo y la probabilidad.