Una normal dividida por le da una distribución t - prueba


10

dejemos y .ZN(0,1)Wχ2(s)

Si y se distribuyen independientemente, entonces la variable sigue una distribución con grados de libertad .ZWY=ZW/sts

Estoy buscando una prueba de este hecho, una referencia es lo suficientemente buena si no desea escribir el argumento completo.


1
Esto se demuestra formalmente en stats.stackexchange.com/questions/52906 : la relación, cuando se escribe como una integral, se ve como una mezcla de gaussianos, y esa demostración muestra que la mezcla está en distribución.
whuber

En algunos libros de texto, esta es una definición de una distribución t. No necesitas probarlo. Sin embargo, cómo derivar un pdf dada una definición de este tipo es una pregunta válida.
mpiktas

Respuestas:


12

Sea una variable aleatoria de chi-cuadrado con grados de libertad. Luego, la raíz cuadrada de , se distribuye como una distribución chi con grados de libertad, que tiene una densidad YnYYY^n

(1)fY^(y^)=21n2Γ(n2)y^n1exp{y^22}

Definir . Entonces , y por la fórmula de cambio de variable tenemos queX1nY^Y^X=n

fX(x)=fY^(nx)|Y^X|=21n2Γ(n2)(nx)n1exp{(nx)22}n

(2)=21n2Γ(n2)nn2xn1exp{n2x2}

Sea una variable aleatoria normal estándar, independiente de las anteriores, y defina la variable aleatoriaZ

T=ZYn=ZX
.

Por la fórmula estándar para la función de densidad de la razón de dos variables aleatorias independientes,

fT(t)=|x|fZ(xt)fX(x)dx

Pero para el intervalo porque es un rv no negativo Entonces podemos eliminar el valor absoluto y reducir la integral afX(x)=0[,0]X

fT(t)=0xfZ(xt)fX(x)dx

=0x12πexp{(xt)22}21n2Γ(n2)nn2xn1exp{n2x2}dx

(3)=12π21n2Γ(n2)nn20xnexp{12(n+t2)x2}dx

El integrando en parece prometedor para eventualmente transformarse en una función de densidad Gamma. Los límites de integración son correctos, por lo que necesitamos manipular el integrando para que se convierta en una función de densidad Gamma sin cambiar los límites. Define la variable(3)

mx2dm=2xdxdx=dm2x,x=m12
Haciendo la sustitución en el integrando tenemos

(4)I3=0xnexp{12(n+t2)m}dm2x=120mn12exp{12(n+t2)m}dm

La densidad gamma se puede escribir

Gamma(m;k,θ)=mk1exp{mθ}θkΓ(k)

Coeficientes coincidentes, debemos tener

k1=n12k=n+12,1θ=12(n+t2)θ=2(n+t2)

Para estos valores de y los términos en el integrando que involucra la variable son el núcleo de una densidad gamma. Entonces, si dividimos el integrando por y multiplicamos fuera de la integral por la misma magnitud, la integral será la distribución gamma. funcionará y será igual a la unidad. Por eso hemos llegado akθ(θ)kΓ(k)

I3=12(θ)kΓ(k)=12(2n+t2)n+12Γ(n+12)=2n12nn+12Γ(n+12)(1+t2n)12(n+1)

Insertar lo anterior en la ecuación. obtenemos(3)

fT(t)=12π21n2Γ(n2)nn22n12nn+12Γ(n+12)(1+t2n)12(n+1)

=Γ[(n+1)/2]nπΓ(n/2)(1+t2n)12(n+1)

... que es lo que se llama (función de densidad) de la distribución t de Student, con grados de libertad.n


23

Aunque a ES Pearson no le gustó, el argumento original de Fisher fue geométrico, simple, convincente y riguroso. Se basa en una pequeña cantidad de hechos intuitivos y fáciles de establecer. Se visualizan fácilmente cuando o , donde la geometría se puede visualizar en dos o tres dimensiones. En efecto, equivale a utilizar coordenadas cilíndricas en para analizar iid variables normales.s=1s=2Rs×Rs+1

  1. s+1 independientes e idénticamente distribuidas Las variables normales son esféricamente simétricas. Esto significa que la proyección radial del punto en la esfera de la unidad tiene una distribución uniforme en .X1,,Xs+1(X1,,Xs+1)SsRs+1Ss

  2. Una es la de la suma de cuadrados de las variables normales estándar independientes de .χ2(s)s

  3. Por lo tanto, estableciendo y , la relación es la tangente de la latitud del punto en .Z=Xs+1W=X12++Xs2Z/Wθ(X1,,Xs,Xs+1)Rs+1

  4. tanθ no cambia por proyección radial en .Ss

  5. El conjunto determinado por todos los puntos de latitud en es una esfera dimensional de radio . Su medida dimensional por lo tanto, es proporcional aθSss1cosθs1

    coss1θ=(1+tan2θ)(s1)/2.

  6. El elemento diferencial es .d(tanθ)=cos2θdθ=(1+tan2θ)dθ

  7. Escribir da , de donde y Juntas, estas ecuaciones implicanLa incorporación del factor de en una constante de normalización muestra que la densidad de es proporcional at=Z/W/s=stanθtanθ=t/s

    1+t2/s=1+tan2θ
    dt=sdtanθ=s(1+tan2θ)dθ.
    dθ=1s(1+t2/s)1dt.
    1/sC(s)t

    (1+tan2θ)(s1)/2dθ=(1+t2/s)(s1)/2 (1+t2/s)1dt=(1+t2/s)(s+1)/2dt.

Esa es la densidad t de Student.

Figura

La figura representa el hemisferio superior (con ) de en . Las hachas cruzadas atraviesan el aviónLos puntos negros son parte de una muestra aleatoria de una distribución normal estándar -variable: son los valores que se proyectan a una latitud dada constante , que se muestra como la banda amarilla. La densidad de estos puntos es proporcional al volumen -dimensional de esa banda, que es un de radio . El cono sobre esa banda se dibuja para terminar a una altura de . Hasta un factor deZ0SsRs+1Ws+1θs1Ss1θtanθs, la distribución de t de Student con grados de libertad es la distribución de esta altura ponderada por la medida de la banda amarilla al normalizar el área de la esfera unitaria a la unidad.sSs

Por cierto, la constante de normalización debe ser (como se mencionó anteriormente) veces los volúmenes relativos de las esferas ,1/s

C(s)=1s|Ss1||Ss|=1ssπs/2Γ(s+12+1)(s+1)π(s+1)/2Γ(s2+1)=1ssπs/2(s+1)/2Γ(s+12)(s+1)π(s+1)/2(s/2)Γ(s2)=Γ(s+12)sπΓ(s2).

La expresión final, aunque convencional, disfraza ligeramente la expresión inicial bellamente simple, que revela claramente el significado de .C(s)


Fisher explicó esta derivación a WS Gosset (el "Estudiante" original) en una carta. Gosset intentó publicarlo, dándole crédito completo a Fisher, pero Pearson rechazó el documento. El método de Fisher, aplicado al problema sustancialmente similar pero más difícil de encontrar la distribución de un coeficiente de correlación de la muestra, fue finalmente publicado.

Referencias

RA Fisher, Distribución de frecuencia de los valores del coeficiente de correlación en muestras de una población indefinidamente grande. Biometrika vol. 10, núm. 4 (mayo de 1915), págs. 507-521. Disponible en la Web en https://stat.duke.edu/courses/Spring05/sta215/lec/Fish1915.pdf (y en muchos otros lugares mediante la búsqueda, una vez que este enlace desaparezca).

Joan Fisher Box, Gosset, Fisher y la distribución t. El estadístico estadounidense , vol. 35, núm. 2 (mayo de 1981), págs. 61-66. Disponible en la Web en http://social.rollins.edu/wpsites/bio342spr13/files/2015/03/Studentttest.pdf .

EL Lehmann, Fisher, Neyman y la creación de estadísticas clásicas. Springer (2011), Capítulo 2.


Esta es una prueba fantástica! Espero sinceramente que encuentre este mensaje, aunque han pasado varios años. En el sexto paso de esta prueba, creo que hay un error. Cos ^ -2 (theta) = (1 + tan ^ 2 (theta)), no su inverso. Orar hay una solución fácil?
Entusiasta de las matemáticas el

@ Math Gracias por sus comentarios. No encuentro ningún error en el paso 6. Quizás esté intentando leer " " (que significa el poder de ) como si significara " "? cos2(θ)2cos(θ)(ArcCos(θ))2
whuber

1
Usé la identidad simple para deducir que en la línea 5 Pero por este mismo razonamiento en la línea 6, . Esto entra en conflicto con la afirmación de que el elemento diferencial es igual asec2θ=tan2θ+1cosθ=(tan2θ+1)1/2cos2θ=sec2θ=(tan2θ+1)(tan2θ+1)1
Entusiasta matemático el

@ Math Gracias, tienes razón, por supuesto. He editado los puntos (6) y (7) para corregir el álgebra.
whuber

1
¡Qué alivio! Felices fiestas para ti
Entusiasta de las matemáticas el

1

Intentaría cambiar las variables. Establezca y por ejemplo. Entonces , . Entonces. Donde es la matriz jacobiana de la función multivariable de y de y . Entonces puede integrar fuera de la densidad de la junta. , , , yY=ZWsX=ZZ=XW=sX2Y2fX,Y(x,y)=fZ,W(x,sx2y2)|det(J)|JZWXYxZX=1ZY=0WX=2sXY2WY=2sX2Y3 .

J=(102sX2Y3)

Entonces . Me tomó un vistazo a los elementos de la teoría de la distribución por Thomas A. Severini y allí, tomo . Integrar las cosas se vuelve más fácil usando las propiedades de una distribución de Gaama. Si uso , probablemente necesite completar cuadrados.|det(J)|=2sx2y3X=WX=Z

Pero no quiero hacer el cálculo.


1
No te rechacé, de hecho, simplemente te voté a ti. Pero creo que tal vez el voto negativo llegó antes de su edición.
Monolite

Lo siento, tendré cuidado de ahora en adelante.
ztyh
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.