¿Cómo demostrar que una estadística suficiente NO es lo suficientemente mínima?

El problema de mi tarea es dar un contraejemplo en el que una estadística determinada no sea, en general, lo suficientemente mínima. Independientemente de los detalles de encontrar un contraejemplo particular para esta estadística particular, esto me plantea la siguiente pregunta:

Pregunta: ¿Cómo se puede formular la condición de no ser una estadística mínima suficiente de una manera que sea posible demostrar que una estadística suficiente satisface la condición?

Trabajo hasta ahora: La definición de estadística mínima suficiente en mi libro de texto (Keener, Estadísticas teóricas: Temas para un curso básico ) es la siguiente:

Una estadística $T$ es mínimo suficiente si $T$ es suficiente y, por cada estadística suficiente $\tilde{T}$ existe una función $f$ tal que $T = f(\tilde{T})$ ae $\mathcal{P}$ .

Tenga en cuenta que (ae $\mathcal{P}$ ) significa que el conjunto donde falla la igualdad es un conjunto nulo para cada distribución de probabilidad $P$ en el modelo estadístico $\mathcal{P}$ , $P \in \mathcal{P}$ .

Intentando negar esto, llego a:

Una estadística no es lo suficientemente mínimo si al menos uno de los siguientes se cumple:
1. $T$ No es suficiente.
2. Existe al menos una estadística suficiente $\tilde{T}$ para el que no hay función $f$ tal que $T = f(\tilde{T})$ ae $\mathcal{P}$ .

Entonces, si una estadística es suficiente, entonces parece que sería extremadamente difícil demostrar que no es lo suficientemente mínima, incluso si no es lo suficientemente mínima. (Porque uno tendría que mostrar 2. en lugar de 1., ya que 1. es falso, pero 2. sería muy difícil de mostrar porque, incluso si uno tiene una estadística de contraejemplo $\tilde{T}$ en mente, uno todavía tiene que mostrar la inexistencia de cualquier función con esa propiedad. Y la no existencia es a menudo difícil de mostrar).

Mi libro de texto no ofrece condiciones equivalentes (es decir, necesarias y suficientes) para que una estadística sea una estadística mínima suficiente. Ni siquiera da ninguna condición alternativa necesaria para que una estadística sea estadística mínima suficiente (además de ser una estadística suficiente).

Por lo tanto, para mi problema de tarea, si no puedo demostrar que la estadística no es suficiente (porque lo es), ¿cómo podría demostrar que no es lo suficientemente mínima?

self-study mathematical-statistics sufficient-statistics

— Chill2Macht
fuente

¿Ha considerado comenzar con una estadística mínima suficiente y luego ampliarla para incluir más componentes?

— whuber

En matemáticas en general, a menudo se demuestra la inexistencia de algo al suponer que existe y usarlo para encontrar una contracción.

— Kodiologist

Una estadística es una función vectorial de los datos. Tiene componentes. Por ejemplo, una estadística mínima suficiente para la familia normal de distribuciones es el vector doble que consiste en la media muestral y la varianza muestral. Junto a más componentes, por ejemplo, agregue la asimetría de la muestra y la curtosis, le brinda una estadística con cuatro componentes. Mi sugerencia simplemente decía lo obvio: esta nueva estadística obviamente es suficiente, porque sus dos primeros componentes ya son suficientes. ¿Pero es lo suficientemente mínimo ?

— whuber

No veo cómo alguna de esas observaciones sobre biyecciones u homeomorfismos podría ser relevante. ¿Está utilizando alguna definición inusual de "estadística" o "suficiente"?

— whuber

Parece que está utilizando algún tipo de definición no convencional de suficiencia. En mi ejemplo, todo lo que importa es que las nuevas estadísticas son estadísticas genuinas, funciones medibles de los datos. El mapa de

R^{4}

$\mathbb{R}^4$ a

R^{2}

$\mathbb{R}^2$ (que recupera las dos estadísticas originales, la mínima suficiente) es medible (de hecho, diferenciable). Eso es todo lo que tienes que verificar.

— whuber

Respuestas:

Como dijiste:

Si existe $x1,x2∈X$ tal que $f(x1)=f(x2)$ pero $g(x1)≠g(x2)$ , entonces $g$ no se puede escribir en función de $f$ , es decir, no existe ninguna función $h$ con $g=h∘f$ .

Entonces, por ejemplo, en el caso donde $X_1, ...., X_n$ son variables aleatorias independientes de Bernoulli. Podemos probar que $(x_1, ...., x_n)$ no es mínimamente suficiente al demostrar que no es una función de $\sum x_i$ . Esto es obvio, ya que la función debe mapearse $1$ a ambos $(1,0,0...,0,0,0)$ y $(0,0,0...,0,0,1)$ .

— Euclides
fuente

He estado pensando en este problema un poco más recientemente, y esto es lo que se me ocurrió.

Dejar $\Omega$ ser un espacio de probabilidad, luego una variable aleatoria $X$ es una función medible $X: \Omega \to \mathcal{X}$ , dónde $\mathcal{X}$ es un espacio medible $\mathcal{X}$ tiene un designado $\sigma$ -álgebra, y $X$ es medible con respecto a esto $\sigma$ -álgebra y el $\sigma$ -álgebra en $\Omega$ ) La distribución de $X$ es solo la medida de retroceso en $\mathcal{X}$ es decir $\mathbb{P}_{\mathcal{X}}(A) = \mathbb{P}_{\Omega}(X^{-1}(A))$ . Entonces una estadística de $X$ es cualquier función medible * $f: \mathcal{X} \to \mathcal{Y}$ , dónde $\mathcal{Y}$ Es otro espacio arbitrario medible.

Dadas dos estadísticas $f: \mathcal{X} \to \mathcal{Y}$ , $g: \mathcal{X} \to \mathcal{Z}$ , ¿qué significa para " $g$ ser una función de $f$ "?

Por lo que puedo decir, parece significar que existe una función ** medible $h: \mathcal{Y} \to \mathcal{Z}$ tal que $g = h \circ f$ es decir que $g$ puede ser factorizado a través de $f$ .

(En otras palabras, " $g$ debe estar bien definido como una función en $f(\mathcal{X}) \subseteq \mathcal{Y}$ ".)

Entonces, ¿cuándo es posible tal factorización? Pensemos en términos de relaciones de equivalencia. Específicamente, defina la relación de equivalencia $\sim_f$ en $\mathcal{X}$ por $x_1 \sim_f x_2 \iff f(x_1) = f(x_2)$ , asimismo, defina la relación de equivalencia $\sim_g$ en $\mathcal{X}$ por $x_1 \sim_g x_2 \iff g(x_1) = g(x_2)$ .

Entonces para $g$ ser factorizable por $f$ , las relaciones de equivalencia $\sim_f$ y $\sim_g$ deben ser compatibles entre sí, en el sentido de que para cualquier $x_1, x_2 \in \mathcal{X}$ , $x_1 \sim_f x_2 \implies x_1 \sim_g x_2$ es decir $g$ no puede tomar dos elementos que son equivalentes bajo $f$ y asignarlos a valores que no son equivalentes bajo $g$ es decir " $g$ no puede deshacer la reducción de información realizada previamente por $f$ ".

En otras palabras, $g$ tiene que estar bien definido como una función en $\mathcal{X}/\sim_f \cong f(\mathcal{X})$ , es decir, existe tiene que existir una función $\tilde{g}: \mathcal{X}/\sim_f \to \mathcal{Z}$ tal que $g = \tilde{g} \circ \pi_f$ , dónde $\pi_f$ es la proyección canónica $\mathcal{X} \to \mathcal{X}/\sim_f$ . (Para aquellos que se sienten incómodos con la falta de sentido abstracta, $\pi_f$ Es esencial $f$ y $\tilde{g}$ Es esencial $h$ . La formulación anterior solo aclara las analogías con otras situaciones).

En palabras más simples posibles, $g$ se puede escribir en función de $f$ si y solo si, para cualquier $x_1, x_2 \in \mathcal{X}$ , $f(x_1) = f(x_2) \implies g(x_1) = g(x_2)$ .

Por ejemplo, tome $\mathcal{X} = \mathcal{Y} = \mathcal{Z} = \mathbb{R}$ y $X$ una variable aleatoria arbitraria de valor real, entonces $g: x \mapsto x^2$ se puede escribir en función de $f: x \mapsto x$ , pero no al revés, porque $x_1 = x_2 \implies x_1^2 = x_2^2$ , pero $1^2 = (-1)^2$ pero $1 \not= -1$ .

En particular, suponga que cada clase de equivalencia bajo $\sim_f$ es un singleton (es decir $f$ es inyectiva ). Entonces $g$ siempre se puede escribir en función de $f$ , ya que $\mathcal{X}/\sim_f \cong \mathcal{X}$ es decir $f(x_1) = f(x_2) \implies x_1 = x_2$ significa que $x_1 = x_2 \iff f(x_1) = f(x_2)$ (en general, para no necesariamente inyectiva $f$ , solo se mantiene una dirección), por lo que nuestra condición se convierte en $x_1 = x_2 \implies g(x_1) = g(x_2)$ , que está trivialmente satisfecho por cualquier $g: \mathcal{X} \to \mathcal{Z}$ . (Definir $h$ , puede hacer lo que quiera en $\mathcal{Y} \setminus f(\mathcal{X})$ siempre que sea medible, y luego para cualquier $y \in f(\mathcal{X})$ , es decir, tal que $y = f(x)$ para algunos $x \in \mathcal{X}$ , definir $h$ ser - estar $h: y = f(x) \mapsto g(x)$ . Esto está bien definido cuando $f$ es inyectiva porque hay un único $x \in \mathcal{X}$ tal que $f(x) = y$ . En términos más generales, esto solo se define cuando, independientemente de qué $x$ elegimos en $f^{-1}(y)$ , $g(x)$ sigue siendo el mismo valor, es decir $f(x_1)=f(x_2)\ (=y) \implies g(x_1)=g(x_2)$ .)

Además, al observar el Teorema 3.11 en Keener, su declaración es un poco torpe, pero pensando en los términos anteriores, creo que puede reescribirse como:

Suponer $T$ es una estadística suficiente ****. Entonces una condición suficiente para $T$ ser lo suficientemente mínimo es que se puede escribir en función de la razón de probabilidad.

A partir de esto, queda claro de inmediato que la razón de probabilidad tiene que ser en sí misma mínima suficiente.

Esto también lleva a la conclusión de que:

Si existe $x_1, x_2 \in \mathcal{X}$ tal que $f(x_1)=f(x_2)$ pero $g(x_1) \not= g(x_2)$ , entonces $g$ puede no ser escrito como una función de $f$ , es decir, no existe ninguna función $h$ con $g = h \circ f$ .

Por lo tanto, la condición no es tan difícil de mostrar como había pensado.

* Keener no aborda la cuestión de si una estadística debe ser medible o simplemente una función arbitraria o no. Sin embargo, estoy bastante seguro de que una estadística tiene que ser una función medible, porque de lo contrario no podríamos definir una distribución por ella , es decir, una medida de retirada.

**Si $h$ no eran medibles, tendríamos una contradicción porque ambos $f$ y $g$ son medibles y la composición de las funciones medibles es nuevamente medible. Por lo menos, $h$ tiene que ser medible restringido a $f(\mathcal{X}) \subseteq \mathcal{Y}$ , aunque creo que esto significaría en la mayoría de los casos razonables que $h$ tendría que estar de acuerdo $f(\mathcal{X})$ con una función que se puede medir en todos $\mathcal{Y}$ (tomar $h|_{f(\mathcal{X})}$ en $f(\mathcal{X})$ y por ejemplo $z$ en $Y \setminus f(\mathcal{X})$ si existe un punto medible $z \in \mathcal{Z}$ , tenga en cuenta que ambos $f(\mathcal{X})$ y $Y \setminus f(\mathcal{X})$ debe ser medible en $Y$ ) así que wlog $h$ se puede suponer que se puede medir en todos $\mathcal{Y}$ .

*** Al menos esto es necesario y suficiente para la existencia de una función arbitraria que factoriza a través de $g$ y más $f$ , y creo que ** implica que si existe tal función arbitraria, esta función también debe ser medible, ya que ambas $f$ y $g$ son, es decir, realmente sería una estadística $\mathcal{Y} \to \mathcal{Z}$ .

**** La condición dada es equivalente a $T$ siendo suficiente por el teorema de factorización, 3.6.

— Chill2Macht
fuente

¿Cómo define la razón de probabilidad?

— Xi'an

@ Xi'an Realmente no recuerdo todas las estupideces que escribí arriba, así que para ser honesto, no estoy seguro de a qué parte te refieres. Si está sugiriendo implícitamente que primero demuestro que el estadístico de razón de probabilidad es lo suficientemente mínimo, y luego reduzco cualquier otra prueba de suficiencia mínima a una "equivalencia de suficiencia" adecuada con el estadístico de razón de probabilidad, eso probablemente sea útil en la práctica, pero al menos teóricamente solo parece patear la lata en el camino (porque entonces, ¿cómo se entiende la prueba de suficiencia mínima de la estadística LR?)

— Chill2Macht