Intervalo de confianza para la variación dada una observación

Este es un problema de la "VII Olimpiada de Estudiantes de Kolmogorov en Teoría de la Probabilidad":

Dada una observación de una distribución con ambos parámetros desconocidos, proporcione un intervalo de confianza para con un nivel de confianza de al menos 99%. $X$ $\operatorname{Normal}(\mu,\sigma^2)$ $\sigma^2$

Me parece que esto debería ser imposible. Tengo la solución, pero aún no la he leído. ¿Alguna idea?

Publicaré la solución en un par de días.

[Edición de seguimiento: solución oficial publicada a continuación. La solución de Cardinal es más larga, pero ofrece un mejor intervalo de confianza. Gracias también a Max y Glen_b por su aporte.]

— Jonathan Christensen
fuente

También me parece imposible; Espero la respuesta

— Peter Flom - Restablece a Monica

Echa un vistazo a este sitio .

— asumido el

Aquí hay un documento con mejor formato: papel .

— asumido el

Je Recuerdo haber leído un artículo sobre estas cosas (intervalos de una observación) hace muchos años. Podría haber sido este .

— Glen_b -Reinstate Monica

@ Max, gracias por el enlace! Todavía no he tenido tiempo de mirarlo de cerca, pero lo haré. Publiqué la respuesta "oficial" a continuación.

— Jonathan Christensen

Respuestas:

Visto a través del lente de las desigualdades de probabilidad y las conexiones con el caso de observación múltiple, este resultado podría no parecer tan imposible o, al menos, podría parecer más plausible.

Deje con y desconocido. Podemos escribir para . $\renewcommand{\Pr}{\mathbb P}\newcommand{\Ind}[1]{\mathbf 1_{(#1)}}X \sim \mathcal N(\mu,\sigma^2)$ $\mu$ $\sigma^2$ $X = \sigma Z + \mu$ $Z \sim \mathcal N(0,1)$

Reclamación principal : es un intervalo de confianza para donde es el cuantil nivel de una distribución chi-cuadrado con un grado de libertad. Además, puesto que este intervalo tiene exactamente la cobertura cuando , que es el intervalo más estrecho posible de la forma para algunos . $[0,X^2/q_\alpha)$ $(1-\alpha)$ $\sigma^2$ $q_\alpha$ $\alpha$ $(1-\alpha)$ $\mu = 0$ $[0,b X^2)$ $b \in \mathbb R$

Un motivo de optimismo

Recuerde que en el caso , con , el intervalo de confianza típico para es donde es la cuantil -level de la chi-cuadrado con grados de libertad. Esto, por supuesto, vale para cualquier . Si bien este es el intervalo más popular (llamado intervalo de cola igual por razones obvias), ¡no es el único ni siquiera el de menor ancho! Como debería ser evidente, otra selección válida es $n \geq 2$ $T = \sum_{i=1}^n (X_i - \bar X)^2$ $(1-\alpha)$ $\sigma^2$

(\frac{T}{q_{n - 1, (1 - α) / 2}}, \frac{T}{q_{n - 1, α / 2}}),

$\Big(\frac{T}{q_{n-1,(1-\alpha)/2}}, \frac{T}{q_{n-1,\alpha/2}} \Big) \>,$

q_{k, a}

$q_{k,a}$

a

$a$

k

$k$

μ

$\mu$

(0, \frac{T}{q_{n - 1, α}}) .

$\Big(0,\frac{T}{q_{n-1,\alpha}}\Big) \>.$

Desde entonces, , luego también tiene una cobertura de al menos . $T \leq \sum_{i=1}^n X_i^2$

(0, \frac{\sum_{i = 1}^{n} X_{i}^{2}}{q_{n - 1, α}}),

$\Big(0,\frac{\sum_{i=1}^n X_i^2}{q_{n-1,\alpha}}\Big) \>,$

(1 - α)

$(1-\alpha)$

Visto desde esta perspectiva, podríamos ser optimistas de que el intervalo en el reclamo principal es verdadero para . La principal diferencia es que no existe una distribución chi-cuadrado de cero grados de libertad para el caso de una sola observación, por lo que debemos esperar que el uso de un cuantil de un grado de libertad funcione. $n = 1$

Medio paso hacia nuestro destino ( Explotando la cola derecha )

Antes de sumergirnos en una prueba del reclamo principal, primero veamos un reclamo preliminar que no es tan fuerte o satisfactorio estadísticamente, pero que tal vez da una idea adicional de lo que está sucediendo. Puede pasar a la prueba de la reclamación principal a continuación, sin mucha (si alguna) pérdida. En esta sección y en la siguiente, las pruebas, aunque ligeramente sutiles, se basan solo en hechos elementales: monotonicidad de probabilidades, y simetría y unimodalidad de la distribución normal.

Reclamo auxiliar : es un intervalo de confianza para siempre que . Aquí es el cuantil nivel de una normal estándar. $[0,X^2/z^2_\alpha)$ $(1-\alpha)$ $\sigma^2$ $\alpha > 1/2$ $z_\alpha$ $\alpha$

Prueba . ypor simetría, entonces en lo que sigue podemos tomar sin pérdida de generalidad. Ahora, para y , y así con , vemos que Esto funciona solo para , ya que eso es lo que se necesita para . $|X| = |-X|$ $|\sigma Z + \mu| \stackrel{d}{=} |-\sigma Z+\mu|$ $\mu \geq 0$ $\theta \geq 0$ $\mu \geq 0$

P (| X | > θ) \geq P (X > θ) = P (σ Z + μ > θ) \geq P (Z > θ / σ),

$\Pr(|X| > \theta) \geq \Pr( X > \theta) = \Pr( \sigma Z + \mu > \theta) \geq \Pr( Z > \theta/\sigma) \>,$

θ = z_{α} σ

$\theta = z_{\alpha} \sigma$

P (0 \leq σ^{2} < X^{2} / z_{α}^{2}) \geq 1 - α .

$\Pr(0 \leq \sigma^2 < X^2 / z^2_\alpha) \geq 1 - \alpha \>.$

α > 1 / 2

$\alpha > 1/2$

z_{α} > 0

$z_\alpha > 0$

Esto prueba el reclamo auxiliar. Si bien es ilustrativo, es insatisfactorio desde una perspectiva estadística, ya que requiere un absurdamente grande para funcionar. $\alpha$

Probar el reclamo principal

Un refinamiento del argumento anterior conduce a un resultado que funcionará para un nivel de confianza arbitrario. Primero, tenga en cuenta que Establezca y . Entonces, Si podemos mostrar que el lado derecho aumenta en por cada fijo , entonces podemos emplear un argumento similar al del argumento anterior. Esto es al menos plausible, ya que nos gustaría creer que si la media aumenta, entonces es más probable que veamos un valor con un módulo que excede

P (| X | > θ) = P (| Z + μ / σ | > θ / σ) .

$\Pr(|X| > \theta) = \Pr(|Z + \mu/\sigma| > \theta / \sigma ) \>.$

a = μ / σ \geq 0

$a = \mu/\sigma \geq 0$

b = θ / σ \geq 0

$b = \theta / \sigma \geq 0$

P (| Z + a | > b) = Φ (a - b) + Φ (- a - b) .

$\Pr(|Z + a| > b) = \Phi(a-b) + \Phi(-a-b) \>.$

a

$a$

b

$b$

b

$b$ . (Sin embargo, tenemos que tener cuidado con la rapidez con la que la masa está disminuyendo en la cola izquierda).

Establezca . Entonces Tenga en cuenta que y para positivo , está disminuyendo en . Ahora, para , es fácil ver que . Estos hechos en conjunto implican fácilmente que para todos y cualquier fijo . $f_b(a) = \Phi(a-b) + \Phi(-a-b)$

f_{b}^{'} (a) = φ (a - b) - φ (- a - b) = φ (a - b) - φ (a + b) .

$f'_b(a) = \varphi(a-b) - \varphi(-a-b) = \varphi(a-b) - \varphi(a+b) \>.$

f_{b}^{'} (0) = 0

$f'_b(0) = 0$

u

$u$

φ (u)

$\varphi(u)$

u

$u$

a \in (0, 2 b)

$a \in (0,2b)$

φ (a - b) \geq φ (- b) = φ (b)

$\varphi(a-b) \geq \varphi(-b) = \varphi(b)$

f_{b}^{'} (a) \geq 0

$f'_b(a) \geq 0$

a \geq 0

$a \geq 0$

b \geq 0

$b \geq 0$

Por lo tanto, hemos demostrado que para y , $a \geq 0$ $b \geq 0$

P (| Z + a | > b) \geq P (| Z | > b) = 2 Φ (- b) .

$\Pr(|Z + a| > b) \geq \Pr(|Z| > b) = 2\Phi(-b) \>.$

Desentrañando todo esto, si tomamos , obtenemos que establece el reclamo principal. $\theta = \sqrt{q_\alpha} \sigma$

P (X^{2} > q_{α} σ^{2}) \geq P (Z^{2} > q_{α}) = 1 - α,

$\Pr(X^2 > q_\alpha \sigma^2) \geq \Pr(Z^2 > q_\alpha) = 1 - \alpha \>,$

Comentario final : una lectura cuidadosa del argumento anterior muestra que usa solo las propiedades simétricas y unimodales de la distribución normal. Por lo tanto, el enfoque funciona de manera análoga para obtener intervalos de confianza de una sola observación de cualquier familia simétrica de escala de ubicación unimodal, por ejemplo, distribuciones de Cauchy o Laplace.

— cardenal
fuente

¡Guauu! y se espera que los estudiantes presenten este tipo de argumento en el corto tiempo de un examen de Olimpiada?

— Dilip Sarwate

@Dilip: ¡No tengo idea! No estoy familiarizado con el formato de esta Olimpiada o lo que se espera en términos de una solución. De una lectura literal, creo que la respuesta de Scortchi sería aceptable. Estaba más interesado en tratar de averiguar hasta dónde llegar con una solución "no trivial". Mi propia exploración (bastante mínima) siguió el mismo tren de pensamiento descrito en la respuesta (con un desvío). Es muy probable que exista una mejor solución. :-)

— cardenal

Esto es considerablemente más largo que la solución "oficial", pero da un mejor límite a la variación, por lo que lo estoy marcando como la respuesta "correcta". He publicado la respuesta "oficial" a continuación, así como algunos resultados de simulación y discusión. ¡Gracias, cardenal!

— Jonathan Christensen

@ Jonathan: Gracias. Sí, podría haber hecho la prueba un poco más breve. Debido a la amplia gama de antecedentes de los participantes aquí, a menudo tiendo a disfrutar de detalles adicionales (o, tal vez, excesivos). :-)

— cardenal

¡Hora de seguir! Aquí está la solución que me dieron:

Construiremos un intervalo de confianza de la forma , donde es alguna estadística. Por definición, este será un intervalo de confianza con un nivel de confianza de al menos 99% if Notamos que la densidad de la distribución no excede . Por lo tanto, para cada . Se deduce que Enchufando $[0,T(X))$ $T(\cdot)$
$(\forall μ \in R) (\forall σ > 0) P_{μ, σ_{2}} (σ^{2} > T (X)) < 0.01.$ $(\forall \mu \in \mathbb R )(\forall \sigma > 0)\; \mathbb P_{\mu,\sigma_2}(\sigma^2 > T(X)) < 0.01.$ $\mathcal{N}(\mu,\sigma^2)$ $1/\sigma\sqrt{2\pi}$ $\mathbb{P}(|X| \leq a) \leq a/\sigma$ $a \geq 0$ $t \geq P (| X | / σ \leq t) = P (X^{2} \leq t^{2} σ^{2}) = P (σ^{2} \geq X^{2} / t^{2}) .$ $t \geq \mathbb P (|X|/\sigma \leq t) = \mathbb P (X^2 \leq t^2\sigma^2) = \mathbb P (\sigma^2 \geq X^2/t^2).$ $t = 0.01$ obtenemos que la estadística apropiada es $T(X) = 10000X^2.$

El intervalo de confianza (que es muy amplio) es ligeramente conservador en la simulación, sin cobertura empírica (en 100,000 simulaciones) inferior al 99,15%, ya que varié el CV en muchos órdenes de magnitud.

A modo de comparación, también simulé el intervalo de confianza del cardenal. Debo señalar que el intervalo del cardenal es bastante más estrecho: en el caso del 99%, su resultado es de aproximadamente , a diferencia del en la solución provista. La cobertura empírica está justo en el nivel nominal, nuevamente en muchos órdenes de magnitud para el CV. Entonces su intervalo definitivamente gana. $6300X^2$ $10000X^2$

No he tenido tiempo de mirar detenidamente el artículo publicado por Max, pero planeo mirar eso y puedo agregar algunos comentarios al respecto más tarde (es decir, no antes de una semana). Ese documento afirma un intervalo de confianza del 99% de , que tiene una cobertura empírica ligeramente menor (alrededor del 98.85%) que la cobertura nominal para CV grandes en mis breves simulaciones. $(0,4900X^2)$

— Jonathan Christensen
fuente

(+1) Esa es una buena solución. ¿Debería tener lugar de en la ecuación de visualización?

t \geq \dots

$t \geq \cdots$

t \leq \dots

$t \leq \cdots$

— cardenal

Un par de puntos más: se puede hacer que su solución esté muy cerca de la mía sin ningún cambio en el argumento. Tenga en cuenta que puede afirmar que . Entonces el intervalo se convierte en para cualquier . Usar produce versus en mi respuesta. Cuanto mayor sea el nivel de confianza (es decir, cuanto menor sea ), más se compara su método con el mío (aunque su intervalo siempre será más amplio).

P (| X | \leq a) \leq 2 a / σ \sqrt{2 π}

$\mathbb P(|X| \leq a) \leq 2 a / \sigma \sqrt{2\pi}$

(0, 2 X^{2} / π α^{2})

$(0,2X^2/\pi\alpha^2)$

α

$\alpha$

α = 0.01

$\alpha = 0.01$

T (X) \approx 6366.198 X^{2}

$T(X) \approx 6366.198 X^2$

1 / q_{0.01} \approx 6365.864

$1/q_{0.01} \approx 6365.864$

α

$\alpha$

— cardenal

En segundo lugar, no he mirado ese documento, pero tengo fuertes dudas de que puede ser un intervalo de confianza válido del 99%. De hecho, considere todos los intervalos de confianza de la forma para algunos . Entonces, cuando , tenemos que es exactamente chi-cuadrado con un grado de libertad y, por lo tanto, el más pequeño que podríamos seleccionar en este caso es . En otras palabras, el intervalo dado en mi respuesta es el más estrecho posible de la forma establecida.

(0, 4900 X^{2})

$(0,4900 X^2)$

(0, b X^{2})

$(0, b X^2)$

b

$b$

μ = 0

$\mu = 0$

X^{2} / σ^{2}

$X^2/\sigma^2$

b

$b$

b = 1 / q_{α}

$b = 1/q_{\alpha}$

— cardenal

Hice la corrección de error (sospechoso). Además, pchisq(1/4900,1,lower.tail=F)en Rlos rendimientos 0.9886, muy cerca de sus resultados de la simulación para el intervalo.

(0, 4900 X^{2})

$(0,4900X^2)$

— cardenal

Gracias por todos los comentarios, @cardinal. Creo que su cambio es correcto, aunque lo escribí como estaba en las soluciones originales: error tipográfico, supongo.

— Jonathan Christensen

Los CI presumiblemente. $(0,\infty)$

— Scortchi - Restablece a Monica
fuente

Creo que sería útil para usted decir por qué no puede obtener un intervalo de confianza de longitud finita.

— asumido normalmente el

@Max No soy lo suficientemente inteligente, pero la pregunta no me hizo ninguna.

— Scortchi - Restablece a Monica

+1 por esto. La pregunta no decía un IC con una cobertura mínima, y de hecho implica que esto podría ser aceptable a través de su curiosa redacción, "un intervalo de confianza con un nivel de confianza de al menos el 99%".

— Ari B. Friedman