¿El significado de representar el simplex como una superficie triangular en la distribución de Dirichlet?


9

Estoy leyendo un libro que introduce la distribución Dirchilet y luego presentó cifras al respecto. Pero realmente no pude entender esas cifras. Adjunté la figura aquí en la parte inferior. Lo que no entiendo son los significados de los triángulos.

Normalmente, cuando se quiere trazar una función de 2 variables, se toma el valor de var1 y va2 y luego se traza el valor del valor de la función de esas dos variables ... lo que proporciona una visualización en una dimensión 3D. Pero aquí hay 3 dimensiones y otro valor para el valor de la función, por lo que se visualiza en el espacio 4D. ¡No puedo entender esas cifras!

¡Espero que alguien pueda aclararlos por favor!

EDITAR: esto es lo que no entiendo de la figura 2.14a. Así que hemos extraído de K = 3 dirichlet una muestra theta (que es básicamente un vector) que es: theta = [theta1, theta2, theta3]. El triángulo representa [theta1, theta2, theta3]. La distancia desde el origen a cada theta_i es el valor de theta_i. Luego, para cada theta_i, puso un vértice y conectó las tres vértices e hizo un triángulo. Sé que si conecto [theta1, theta2, theta3] en dir (theta | a) obtendré un número que es la probabilidad conjunta del vector theta. También entiendo que la probabilidad de variables aleatorias continuas es una medida de un área. Pero aquí tenemos 3 dimensiones, por lo que la probabilidad conjunta será la medida del volumen del espacio desde el plano rosa y debajo ... es decir, la pirámide. Ahora no entiendo cuál es el papel del triángulo aquí.

ingrese la descripción de la imagen aquí


2
Le sugiero que comience desde la distribución beta y trabaje desde allí. El Dirichlet para 3 es "solo" una extensión lógica de beta, que es el Dirichlet para 2.
Andris Birkmanis

Consulte este hilo para ver un ejemplo: stats.stackexchange.com/questions/244917/…
Tim

Puede ser útil pensar que una distribución Beta se muestra en 2D (el eje x representa el resultado binario {0,1} y el eje y representa la probabilidad) por lo que un resultado ternario necesita la dimensión adicional, ¿verdad?
George

Respuestas:


4

No entiendo cuál es el papel del triángulo aquí. ¿Qué está tratando de comunicar o visualizar?

0θ1θ0+θ1+θ2=1

La forma en que finalmente lo entendí es la siguiente:

figura

θ1,2,3

En (b), se muestra un triángulo, este es nuestro simplex.

(c) muestra dos puntos de ejemplo que "ponen" en el simplex que también cumplen el segundo criterio (suma hasta uno).

(d) muestra otro punto de ejemplo en el simplex, se mantienen las mismas restricciones

En (e), traté de mostrar una proyección del símplex a un triángulo 2D con todos los puntos de ejemplo mostrados anteriormente.

Espero que tenga más sentido ahora :)


2
Bonito cuadro. ¿Es tuyo? En caso negativo, ¿podría proporcionar una referencia y su fuente?
Tim

1
Gracias. Es mío (dibujado usando Inkscape), puedo proporcionar el SVG si es necesario ...
John Doe

2

θik=3θ. Ahora suponga que inclina ese plano de modo que tenga una pirámide con el plano rosa, la cara más cercana al lector, colocada plana en la página. Luego, suprima la tercera dimensión "emergente" de la página y, en su lugar, coloree el triángulo de modo que la región de mayor densidad, con una distancia más larga desde la base hasta la superficie, sea más roja. Eso es lo que muestran los gráficos 2.14 (b) y 2.14 (c). Cuanto más se concentra el rojo cerca de un vértice, más probable es la clase asociada con ese vértice. Del mismo modo, si la región roja no está muy cerca de ningún vértice, no es especialmente probable que un evento tenga una mayor probabilidad de pertenencia a alguna de las clases.

θθθk=3θθDir(α)


Algunos puntos aún no están claros. Quizás por mi débil inglés. "La región encerrada por el plano rosa y los planos de los ejes es la densidad". ¿Es ese el espacio vacío de la pirámide debajo del plano rosa? También "densidad"? ¿Qué quieres decir? Lo que entiendo es que dir (x1, x2, x3) es un valor, ¿cómo entra aquí la densidad en el gráfico?
Jack Twain

Sí, entre el plano rosa y los planos formados por las líneas negras en 2.14 (a) está el espacio de la pirámide que estaba tratando de describir. ¡Perdón por la confusion!
Sycorax dice Reinstate Monica el

Editaré mi publicación para explicar más lo que aún no está claro
Jack Twain,

La cosa es que la región rosa es exactamente el soporte descrito en el libro. ya que theta_k <= 1 y sum (theta_k) = 1. Una vez que te imaginas eso, user777 tiene toda la razón.
Scratch el

@ user777 Acabo de hacer una edición en la publicación
Jack Twain
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.