¿Cómo determinan los estadísticos qué distribución es apropiada para diferentes pruebas estadísticas?


8

Por ejemplo, el estadístico de prueba calculado para la prueba ANOVA se compara con una distribución F, mientras que un medio de comparación de prueba t compara el estadístico de prueba con una distribución t.


1
Para una descripción general, eche un vistazo a la página 3 de este documento . Contiene un gráfico que representa las relaciones entre muchas distribuciones. Bastante ordenado.
COOLSerdash

En un nivel, la respuesta es simple: la distribución es la del estadístico de prueba bajo la hipótesis nula. Encontrarlo es simplemente un cálculo. Las partes difíciles están creando un modelo de probabilidad adecuado para un problema, generando una función de pérdida y encontrando una estadística de prueba que produce una buena prueba. Muchas distribuciones, incluidas la Normal, y , en realidad aparecen con mayor frecuencia como aproximaciones asintóticas a las distribuciones reales (y ahí radica una parte separada de cualquier buena respuesta). tχ2
whuber

Respuestas:


12

La respuesta completa a su pregunta sería un curso de estadística de teoría matemática de un semestre completo (que sería una buena idea que tome si está realmente interesado).

Pero un conjunto corto y parcial de respuestas son:

Generalmente comenzamos con la distribución normal, se ha encontrado que es una aproximación razonable para muchas situaciones del mundo real y el teorema del límite central (y otros) nos dice que es una aproximación aún mejor cuando se observan los medios de muestras aleatorias simples ( un tamaño de muestra más grande conduce a una mejor aproximación por lo normal Por lo tanto, lo normal es a menudo la distribución predeterminada a considerar si no hay una razón para creer que no será una aproximación razonable. Aunque con las computadoras modernas ahora es más fácil usar herramientas no paramétricas u otras y no necesitamos depender tanto de lo normal (pero el historial / inercia / etc. nos mantiene usando métodos basados ​​en lo normal).

Si eleva al cuadrado una variable que proviene de una distribución normal estándar, entonces sigue una distribución Chi-cuadrado. Si sumas variables de un Chi-cuadrado, obtienes otro Chi-cuadrado (cambio de grados de libertad), lo que significa que la varianza (escalada) sigue a un Chi-cuadrado.

También funciona que una función de la razón de probabilidad sigue una distribución Chi-cuadrado asintóticamente si el nulo es verdadero y se cumplen otros supuestos.

Una normal estándar dividida por la raíz cuadrada de un chi-cuadrado (y algunos parámetros de escala) sigue una distribución t, por lo que el estadístico t común (bajo la hipótesis nula) sigue a la t.

La relación de 2 Chis-cuadrados (dividida por grados de libertad y otras consideraciones) sigue una distribución F. Las pruebas de anova F se basan en la razón de 2 estimaciones de la misma varianza (debajo de la nula) y dado que las variaciones siguen un Chi-cuadrado, la razón sigue una F (bajo la retención de nulos y supuestos).

Las personas inteligentes elaboraron estas reglas para que el resto de nosotros podamos aplicarlas. Un curso completo de matemática / estadística dará más de la historia y las derivaciones (y posiblemente más de las alternativas), esto fue solo una descripción general rápida de las pruebas y distribuciones más comunes.


Gracias, esto es exactamente lo que estaba buscando. Sin embargo, creo que pospondré el curso de estadísticas de teoría matemática por ahora.
Stu

3

Una forma diferente de responder a su pregunta es el siguiente pensamiento secuencial que me gustaría ilustrar con un ejemplo simple:

1) ¿Cuál es la hipótesis nula relacionada con la pregunta de interés? Por ejemplo, en los Estados Unidos, el ingreso promedio es de $ 6000 por mes.

2) ¿Cómo podemos medir la desviación de la hipótesis nula en función de los datos disponibles? Primer intento: Ingreso promedio. Cuanto más lejos de 6000, menos plausible es la hipótesis nula y más debemos rechazarla.T=

3) Encuentre la distribución de si la hipótesis nula es verdadera. Esta "distribución nula" es la base para la decisión de la prueba. En nuestro ejemplo, si la muestra es grande, el Teorema del límite central nos dice que está aproximadamente distribuido normalmente con una media de 6000 y una desviación estándar , donde es la verdadera desviación estándar del ingreso en los EE. UU. . Sabemos que y pueden estimarse mediante la desviación estándar de la muestra .TTσ/nσnσσ^

Principalmente, ahora podríamos reclinarnos y usar este resultado para encontrar decisiones de prueba. Sin embargo, debido a que los estadísticos somos buenos, generalmente intentamos modificar el estadístico de prueba para mantener la distribución nula libre de la mayor cantidad de información dependiente de datos posible. En nuestro ejemplo simple, podríamos utilizar en lugar de . Esta estadística de prueba modificada es siempre aproximadamente normal normal si la hipótesis nula es verdadera. No importa el tamaño de la muestra, la media hipotética y la desviación estándar, la decisión de la prueba siempre se basa en los mismos valores críticos (como ). Esta es la famosa prueba Z de una muestra.

T=(T6000)/(σ^/n)
TT±1.96

-2

Solo hay tres distribuciones basadas en la realidad. (1) El binomio (2) El multinomial (3) El aproximador de Abraham De Moivre al binomio. Las otras distribuciones son expresiones 'derivadas' con un rango dinámico muy limitado y muy poco contacto con la realidad. Ejemplo. Un estadístico le dirá que sus datos se ajustan a una distribución de Poisson. Él realmente creerá que la distribución de Poisson tiene algún tipo de realidad 'independiente'. La verdad es que la distribución de Poisson se aproxima al binomio para cantidades muy pequeñas y muy grandes de sesgo. Ahora que todos tenemos computadoras, no hay razón para recurrir a los aproximadores. Pero, lamentablemente, los viejos hábitos tardan en morir.


1
Una tesis interesante y estimulante, pero en última instancia, poco útil en este contexto. Además, su verdad parece descansar en una idea idiosincrásica y limitada de "basada en la realidad". (Para justificar esa alegación de limitado, considere, entre muchos ejemplos, lo que se necesitaría para obtener distribuciones como la hipergeométrica o Benford de las tres distribuciones nombradas aquí.)
whuber

No veo cómo una computadora alivia la necesidad de aproximar el modelo subyacente a un proceso complejo. La gente no está utilizando la regresión de Poisson porque sus datos se generaron a partir de una gran cantidad de pruebas de Bernoulli donde la probabilidad de éxito disminuye proporcionalmente a la cantidad de pruebas y solo quieren evitarle problemas a su computadora. Lo usan porque es un modelo simple para probar cómo las covariables afectan la media de un resultado de conteo. Un practicante astuto verifica los supuestos de sus modelos pero, hasta que las computadoras se vuelvan psíquicas, usaremos modelos para aproximarnos a la realidad.
Macro

En las ciencias de la vida es importante probar conjuntos de datos contra la distribución binomial. Hacerlo nos da una medida del número total de 'fuentes de error' que corresponde al número de genes que influyen en el proceso. La distribución de Poisson, entre otros, oscurece esta relación.
user10739
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.