Diferencia entre Priors no informativos e impropios

Me pregunto cuál es la diferencia entre estos dos tipos de antecedentes:

No informativo
Incorrecto

bayesian prior improper-prior

— Bram
fuente

Podría ser útil si pudiera proporcionar algún contexto aquí. ¿Qué entiendes sobre estos ya? ¿Hay un punto particular de confusión?

— gung - Restablece a Monica

Enlaces relevantes stats.stackexchange.com/questions/175792/… y stats.stackexchange.com/questions/133707/… y stats.stackexchange.com/questions/73490/…

— Tim

@Tim gracias. Estaba buscando no informativo en lugar de débilmente informativo .

— Bram

Posible duplicado de ¿Qué es un "previo no informativo"? ¿Podemos tener uno que realmente no tenga información?

— Xi'an

Respuestas:

Los previos impropios son -finito no negativo medidas en el espacio de parámetros tal que Como tal, generalizan el noción de una distribución previa, que es una distribución de probabilidad en el espacio de parámetros tal que Son útiles de varias maneras para caracterizar $\sigma$ $\text{d}\pi$ $\Theta$

\int_{Θ} re π (θ) = + \infty

$\int_\Theta \text{d}\pi(\theta) = +\infty$

Θ

$\Theta$

\int_{Θ} re π (θ) = 1

$\int_\Theta \text{d}\pi(\theta) =1$

el conjunto de límites de procedimientos bayesianos adecuados, que no son todos procedimientos bayesianos adecuados;
procedimientos óptimos frecuentes como en (admisibilidad) teoremas de clase completos como el de Wald;
los mejores estimadores invariantes frecuentes (ya que pueden expresarse como estimaciones de Bayes bajo la medida de Haar derecha correspondiente, generalmente inadecuada);
los anteriores derivados de la forma de la función de verosimilitud, como los prioritarios no informativos (por ejemplo, Jeffreys).

Debido a que no se integran a un número finito, no permiten una interpretación probabilística pero, sin embargo, pueden usarse en inferencia estadística si la probabilidad marginal es finita desde la distribución posterior está bien definido. Esto significa que se puede usar exactamente de la misma manera que se usa una distribución posterior derivada de un previo apropiado, para derivar cantidades posteriores para la estimación, como medios posteriores o intervalos creíbles posteriores.

\int_{Θ} ℓ (θ El | X) re π (θ) < + \infty

$\int_\Theta \ell(\theta|x)\text{d}\pi(\theta) < +\infty$

\frac{ℓ (θ El | X) re π (θ)}{\int_{Θ} ℓ (θ El | X) re π (θ)}

$\dfrac{\ell(\theta|x)\text{d}\pi(\theta)}{\int_\Theta \ell(\theta|x)\text{d}\pi(\theta)}$

Advertencia: Una rama de la inferencia bayesiana no hace frente muy bien a los antecedentes impropios, es decir, al probar hipótesis agudas. De hecho, esas hipótesis requieren la construcción de dos distribuciones anteriores, una debajo de la nula y otra debajo de la alternativa, que son ortogonales. Si uno de estos antecedentes es incorrecto, no se puede normalizar y el factor Bayes resultante es indeterminado.

En la teoría de decisión bayesiana, cuando se busca un procedimiento de decisión óptimo bajo la función de pérdida un previo incorrecto es útil en casos en que el problema de minimización permite una solución no trivial (incluso cuando la distribución posterior no está definida). La razón de esta distinción es que la decisión solo depende del producto , lo que significa que es invariante bajo los cambios del previo por términos multiplicativos siempre que la función de pérdida esté dividida por los mismos términos multiplicativos , $\delta$ $L(d,\theta)$ $\text{d}\pi$

\arg min_{re} \int_{Θ} L (re, θ) ℓ (θ El | X) re π (θ)

$\arg \min_d \int_\Theta L(d,\theta)\ell(\theta|x)\text{d}\pi(\theta)$

L (d, θ) d π (θ)

$L(d,\theta)\text{d}\pi(\theta)$

ϖ (θ)

$\varpi(\theta)$

ϖ (θ)

$\varpi(\theta)$

L (re, θ) re π (θ) = \frac{L (re, θ)}{ϖ (θ)} \times ϖ (θ) re π (θ)

$L(d,\theta)\text{d}\pi(\theta)=\dfrac{L(d,\theta)}{\varpi(\theta)}\times\varpi(\theta)\text{d}\pi(\theta)$

Los antecedentes no informativos son clases de distribuciones anteriores (propias o impropias) que se determinan en términos de un determinado criterio informativo que se relaciona con la función de probabilidad, como

Razón insuficiente de Laplace plana anterior;
Jeffreys (1939) anteriores invariables;
previos de entropía máxima (o MaxEnt) (Jaynes, 1957);
descripción mínima longitud previa (Rissanen, 1987; Grünwald, 2005);
referencias anteriores (Bernardo, 1979, 1781; Berger y Bernardo, 1992; Bernardo y Sun, 2012)
Probabilidad previa de coincidencia (Welsh & Peers, 1963; Scricciolo, 1999; Datta, 2005)

y otras clases, algunas de las cuales se describen en Kass y Wasserman (1995). El nombre no informativo es un nombre inapropiado ya que ningún previo nunca es completamente no informativo. Vea mi discusión en este foro. O la diatriba de Larry Wasserman . (Los antecedentes no informativos suelen ser inadecuados).

— Xi'an
fuente

Un previo no informativo, rigurosamente hablando, no es una distribución previa. Esta es una función tal que, si la consideramos como una distribución y aplicamos la fórmula de Bayes, obtenemos una cierta distribución posterior, que tiene como objetivo reflejar lo mejor posible la información contenida en los datos y solo en los datos, o para lograr una buena propiedad de coincidencia frecuente (es decir, un intervalo creíble posterior del es aproximadamente un intervalo de confianza del ). $95\%$ $95\%$

Un previo no informativo es a menudo "impropio". Una distribución tiene una propiedad bien conocida: su integral es igual a una. Se dice que un previo no informativo es incorrecto cuando su integral es infinita (por lo tanto, en tal caso está claro que no es una distribución).

— Stéphane Laurent
fuente

¡Considero que esta definición de "no informativo" antes de ser súper restrictiva!

— Xi'an

@ Xi'an En vista de la brevedad del OP, creo que esta respuesta corta es bastante apropiada.

— Stéphane Laurent

@ Xi'an Es una cita de Bernardo (más o menos). Yo estoy de acuerdo ^^

— Stéphane Laurent

@ Xi'an Todavía no estoy en casa pero, por ejemplo, aquí. Las referencias posteriores se obtienen mediante el uso formal del teorema de Bayes con una función previa de referencia . Benardo dice referencia a la función previa , no a la distribución.

— Stéphane Laurent

Más en serio @ Xi'an, ¿quieres decir que es restrictivo para los antecedentes no informativos bernardianos? Así es, y algunos otros tal vez. Sé que tienes más conocimiento que yo en este tema. Pero estoy orientado a Bernardo (y anteriores coincidentes).

— Stéphane Laurent