La mayor parte de esto es de fondo, salte al final si ya sabe lo suficiente sobre las mezclas de proceso de Dirichlet . Supongamos que estoy modelando algunos datos como provenientes de una mezcla de procesos de Dirichlet, es decir, deje que y condicional en supongaF Y i i i d ∼ ∫ f ( y | θ ) F ( d θ ) .
Aquí y es la medida base previa. Resulta que si para cada observación , si conozco el latente asociado , la probabilidad de en este modelo es donde es el número de valores distintos de (la medida aleatoria es discreta casi con seguridad). Escobar y West desarrollan el siguiente esquema para muestrear usando un Gamma previo; primero escribenα H Y i θ i α L ( α | t ) ∝ α t Γ ( α ) tθiFαπ(α|t)∝π(α)αtΓ(α)
Ahora mi pregunta. ¿Por qué no podemos simplemente escribir y en lugar de utilizar una mezcla de distribuciones Gamma, ¿utiliza una única distribución Gamma? Si presentamos ¿no debería ser capaz de hacer lo mismo pero sin necesidad de usar la mezcla?
Editar para obtener más detalles Más detalles: para completar algunos huecos, el argumento en Escobar y West es que, dejando que tenga una distribución Gamma con forma y signifique , y así podemos introducir una latente para queLos condicionales completos son una distribución para y una mezcla de a y a
Por el mismo argumento, obtuve el mismo resultado pero con para y para . Esto me parece más fácil; ¿Por qué no hacen eso?