He estado pensando en este problema un poco más recientemente, y esto es lo que se me ocurrió.
Dejar Ωser un espacio de probabilidad, luego una variable aleatoria X es una función medible X:Ω→X, dónde X es un espacio medibleX tiene un designado σ-álgebra, y X es medible con respecto a esto σ-álgebra y el σ-álgebra en Ω) La distribución deX es solo la medida de retroceso en Xes decir PX(A)=PΩ(X−1(A)). Entonces una estadística deX es cualquier función medible * f:X→Y, dónde Y Es otro espacio arbitrario medible.
Dadas dos estadísticas f:X→Y, g:X→Z, ¿qué significa para "g ser una función de f"?
Por lo que puedo decir, parece significar que existe una función ** medible h:Y→Z tal que g=h∘fes decir que gpuede ser factorizado a través def.
(En otras palabras, "g debe estar bien definido como una función en f(X)⊆Y".)
Entonces, ¿cuándo es posible tal factorización? Pensemos en términos de relaciones de equivalencia. Específicamente, defina la relación de equivalencia∼f en X por x1∼fx2⟺f(x1)=f(x2), asimismo, defina la relación de equivalencia ∼g en X por x1∼gx2⟺g(x1)=g(x2).
Entonces para g ser factorizable por f, las relaciones de equivalencia ∼f y ∼g deben ser compatibles entre sí, en el sentido de que para cualquier x1,x2∈X, x1∼fx2⟹x1∼gx2es decir g no puede tomar dos elementos que son equivalentes bajo f y asignarlos a valores que no son equivalentes bajo ges decir "g no puede deshacer la reducción de información realizada previamente por f".
En otras palabras, g tiene que estar bien definido como una función en X/∼f≅f(X), es decir, existe tiene que existir una función g~:X/∼f→Z tal que g=g~∘πf, dónde πf es la proyección canónica X→X/∼f. (Para aquellos que se sienten incómodos con la falta de sentido abstracta,πf Es esencial fy g~ Es esencial h. La formulación anterior solo aclara las analogías con otras situaciones).
En palabras más simples posibles, g se puede escribir en función de f si y solo si, para cualquier x1,x2∈X, f(x1)=f(x2)⟹g(x1)=g(x2).
Por ejemplo, tome X=Y=Z=R y X una variable aleatoria arbitraria de valor real, entonces g:x↦x2 se puede escribir en función de f:x↦x, pero no al revés, porque x1=x2⟹x21=x22, pero 12=(−1)2 pero 1≠−1.
En particular, suponga que cada clase de equivalencia bajo ∼f es un singleton (es decir fes inyectiva ). Entoncesg siempre se puede escribir en función de f, ya que X/∼f≅Xes decir f(x1)=f(x2)⟹x1=x2 significa que x1=x2⟺f(x1)=f(x2) (en general, para no necesariamente inyectiva f, solo se mantiene una dirección), por lo que nuestra condición se convierte en x1=x2⟹g(x1)=g(x2), que está trivialmente satisfecho por cualquier g:X→Z. (Definirh, puede hacer lo que quiera en Y∖f(X) siempre que sea medible, y luego para cualquier y∈f(X), es decir, tal que y=f(x) para algunos x∈X, definir h ser - estar h:y=f(x)↦g(x). Esto está bien definido cuandofes inyectiva porque hay un único x∈X tal que f(x)=y. En términos más generales, esto solo se define cuando, independientemente de quéx elegimos en f−1(y), g(x) sigue siendo el mismo valor, es decir f(x1)=f(x2) (=y)⟹g(x1)=g(x2).)
Además, al observar el Teorema 3.11 en Keener, su declaración es un poco torpe, pero pensando en los términos anteriores, creo que puede reescribirse como:
Suponer Tes una estadística suficiente ****. Entonces una condición suficiente paraT ser lo suficientemente mínimo es que se puede escribir en función de la razón de probabilidad.
A partir de esto, queda claro de inmediato que la razón de probabilidad tiene que ser en sí misma mínima suficiente.
Esto también lleva a la conclusión de que:
Si existe x1,x2∈X tal que f(x1)=f(x2) pero g(x1)≠g(x2), entonces gpuede no ser escrito como una función def, es decir, no existe ninguna funciónh con g=h∘f.
Por lo tanto, la condición no es tan difícil de mostrar como había pensado.
* Keener no aborda la cuestión de si una estadística debe ser medible o simplemente una función arbitraria o no. Sin embargo, estoy bastante seguro de que una estadística tiene que ser una función medible, porque de lo contrario no podríamos definir una distribución por ella , es decir, una medida de retirada.
**Si h no eran medibles, tendríamos una contradicción porque ambos f y gson medibles y la composición de las funciones medibles es nuevamente medible. Por lo menos,h tiene que ser medible restringido a f(X)⊆Y, aunque creo que esto significaría en la mayoría de los casos razonables que h tendría que estar de acuerdo f(X) con una función que se puede medir en todos Y (tomar h|f(X) en f(X) y por ejemplo z en Y∖f(X) si existe un punto medible z∈Z, tenga en cuenta que ambos f(X) y Y∖f(X) debe ser medible en Y) así que wlog h se puede suponer que se puede medir en todos Y.
*** Al menos esto es necesario y suficiente para la existencia de una función arbitraria que factoriza a través de g y más f, y creo que ** implica que si existe tal función arbitraria, esta función también debe ser medible, ya que ambas f y g son, es decir, realmente sería una estadística Y→Z.
**** La condición dada es equivalente a T siendo suficiente por el teorema de factorización, 3.6.