¿Cuál es la diferencia entre DP y CRP?
El proceso de restaurante chino (CRP) es una distribución sobre particiones de enteros . La conexión con el Proceso de Dirichlet (DP) existe gracias al teorema de De Finetti.
Teorema de De Finetti: supongamos que tenemos un proceso aleatorio que es infinitamente intercambiable , entonces la probabilidad conjunta tiene una representación como una mezcla:(θ1, ... ,θnorte)p (θ1, ... ,θnorte)
p (θ1, ... ,θnorte) = ∫rePAGS( G )∏i = 1norteG (θyo)
por alguna variable aleatoria .sol
La propiedad de intercambiabilidad significa que no nos importan los índices de las tablas (no nombramos las tablas) y no nos importa el orden de los clientes en una tabla en particular. La partición de clientes en diferentes conjuntos es la única estructura en la que estamos interesados. Esto significa que, dada una partición , no necesitamos conocer las asignaciones particulares de clientes a las tablas, solo necesitamos saber el número de clientes en cada mesa.
Teorema de De Finetti no ayuda en la búsqueda de la distribución . Solo dice que debería existir.sol
El proceso de Dirichlet es anterior a las distribuciones . Informalmente, arrojas una distribución de probabilidad y cuando tomas muestras de ella, obtendrás una distribución de probabilidad después de la distribución de probabilidad.
La conexión entre ambos puede establecerse demostrando que si se muestrea a partir de un Proceso de Dirichlet, la ecuación en el teorema de De Finetti se cumple para este particular .solsol
Si
G ∼ D P( α , H)
entonces
p ( {θ( z= 0)0 0, ... ,θ( z= 0)norte0 0} , ... , {θ(z= k)0 0, ... ,θ(z= k)nortek} ) =αkΓ ( α )Γ ( α + n )∏i = 0kΓ (norteyo)
Tenga en cuenta que es descrito por un CRP a través de probabilidades para particiones particulares. Aquí denota un índice de tabla . Y es el número de clientes en la tabla . Para completar, recuerde que el es:p (θ1, ... ,θnorte)z= iyonorteyoyoD P
{ G (UNA1) , ... , G (UNAk) } ∼ D i r i c h l e t ( α H(UNA1) , ... , α H(UNAk) )
Creo que está claro de esta exposición es que la conexión está ahí, pero no debe considerarse trivial. Tenga en cuenta también que no describí el CRP en el sentido de una distribución condicional sobre los clientes individuales entrantes. Esto agregaría otro paso conceptual más entre el CRP y el DP. Mi consejo: siéntase libre de sentirse incómodo al comprender directamente su relación y comience a jugar con la descripción de distribuciones conjuntas y marginales hasta que reproduzca la conexión. La PCR se obtiene al marginar a del DP.sol
Para la conexión entre la probabilidad conjunta y la descripción secuencial de la PCR, ver [1].
¿Qué pasa si la intercambiabilidad no es válida?
Si la intercambiabilidad no se mantiene, ya no hablamos sobre el DP o el CRP, sino sobre el Proceso de Dirichlet dependiente y el Proceso de restaurante chino dependiente. ¡Y naturalmente, la conexión entre ellos se pierde!
Ver [2] para más detalles. El CRP dependiente describe qué cliente quiere sentarse con qué (único) otro cliente. Al agrupar todas las relaciones cliente-cliente podemos realizar una tarea sobre tablas. El CRP dependiente no es marginalmente invariable: la probabilidad de una partición al eliminar un cliente también depende de ese mismo cliente. Por el contrario, el DP dependiente a menudo se define por este muy marginal: . Aquí es, por ejemplo, una distribución de Dirichlet o cualquier distribución que hace que y estén relacionados.solt∼ D P( α , H)Hsoltsolt′
Hay muchas otras generalizaciones posibles, algunas de ellas admitirán una representación sobre particiones y sobre distribuciones, como el proceso de restaurante chino con dos parámetros con el proceso Pitman-Yor, o el proceso buffet indio con el proceso beta [3] . Algunos de ellos no lo harán.
- [1] : Un tutorial sobre modelos no paramétricos bayesianos (2011) Gershman y Blei
- [2] : Procesos de restaurantes chinos dependientes de la distancia (2011) Blei y Frazier
- [3] : Procesos beta jerárquicos y el proceso buffet indio (2007) Thibaux y Jordan