¿Cuál es la diferencia de significado entre la notación y que se usan comúnmente en muchos libros y documentos?P
¿Cuál es la diferencia de significado entre la notación y que se usan comúnmente en muchos libros y documentos?P
Respuestas:
Creo que el origen de esto es el paradigma de probabilidad (aunque no he verificado la corrección histórica real de lo siguiente, es una forma razonable de entender cómo surgió).
Digamos que en una configuración de regresión, tendrías una distribución: p (Y | x, beta) Lo que significa: la distribución de Y si conoces (condicionalmente) los valores de x y beta.
Si desea estimar las betas, desea maximizar la probabilidad: L (beta; y, x) = p (Y | x, beta) Esencialmente, ahora está viendo la expresión p (Y | x, beta) como una función de los beta, pero aparte de eso, no hay diferencia (para las expresiones matemáticas correctas que puede derivar correctamente, esto es una necesidad, aunque en la práctica nadie se molesta).
Luego, en la configuración bayesiana, la diferencia entre los parámetros y otras variables pronto se desvanece, por lo que uno comenzó a usar ambas anotaciones entremezcladas.
Entonces, en esencia: no existe una diferencia real: ambos indican la distribución condicional de la cosa a la izquierda, condicional a la (s) cosa (s) a la derecha.
X x θ f ( x , θ ) X Θ ( x , θ ) Θ f ( x | θ ) X Θ Θ es la densidad de la variable aleatoria en el punto , siendo el parámetro de la distribución. es la densidad conjunta de y en el punto y solo tiene sentido si es una variable aleatoria. es la distribución condicional de dada , y nuevamente, solo tiene sentido si es una variable aleatoria. Esto se volverá mucho más claro cuando profundice en el libro y observe el análisis bayesiano.
es lo mismo que , simplemente significa que es un parámetro fijo y la función es una función de . , OTOH, es un elemento de una familia (o conjunto) de funciones, donde los elementos están indexados por . Una distinción sutil, tal vez, pero importante, especialmente. cuando llega el momento de estimar un parámetro desconocido sobre la base de datos conocidos ; en ese momento, varíaes fijo, lo que resulta en la "función de probabilidad". El uso de es más común entre los estadísticos, mientras que entre matemáticos
Aunque no siempre ha sido así, en estos días generalmente se usa cuando no son variables aleatorias (lo que no quiere decir que sean conocidas, necesariamente). indica condicionamiento en los valores de . El condicionamiento es una operación en variables aleatorias y, como tal, usar esta notación cuando no son variables aleatorias es confuso (y trágicamente común).d , w P ( z | d , w ) d , w d , w
Como @Nick Sabbe señala es una notación común para la distribución de muestreo de los datos observados . Algunos frecuentistas usarán esta notación pero insisten en que no es una variable aleatoria, lo cual es un abuso de la OMI. Pero no tienen el monopolio allí; También he visto a bayesianos hacerlo, añadiendo hiperparámetros fijos al final de los condicionales.y Θ