Digamos que depende de α . Hablando rigurosamente
si y α son variables aleatorias, podríamos escribir p ( X ∣ α ) ;
sin embargo, si es una variable aleatoria y α es un parámetro, tenemos que escribir p ( X ; α ) .
Noté varias veces que la comunidad de aprendizaje automático parece ignorar las diferencias y abusar de los términos.
Por ejemplo, en el famoso modelo LDA, donde es el parámetro Dirichlet en lugar de una variable aleatoria.
¿No debería ser ? Veo que muchas personas, incluidos los autores originales del artículo de LDA, lo escriben como p ( θ ∣ α ) .
66
Hablando matemáticamente, siempre puedes condicionar una constante, ya que este es un caso limitante de variable aleatoria. Desde un punto de vista bayesiano, todas las incógnitas se tratan como variables aleatorias, por lo que tiene sentido utilizar la notación de condicionamiento por todas partes.
—
Xi'an