Por ejemplo, el estadístico de prueba calculado para la prueba ANOVA se compara con una distribución F, mientras que un medio de comparación de prueba t compara el estadístico de prueba con una distribución t.
Por ejemplo, el estadístico de prueba calculado para la prueba ANOVA se compara con una distribución F, mientras que un medio de comparación de prueba t compara el estadístico de prueba con una distribución t.
Respuestas:
La respuesta completa a su pregunta sería un curso de estadística de teoría matemática de un semestre completo (que sería una buena idea que tome si está realmente interesado).
Pero un conjunto corto y parcial de respuestas son:
Generalmente comenzamos con la distribución normal, se ha encontrado que es una aproximación razonable para muchas situaciones del mundo real y el teorema del límite central (y otros) nos dice que es una aproximación aún mejor cuando se observan los medios de muestras aleatorias simples ( un tamaño de muestra más grande conduce a una mejor aproximación por lo normal Por lo tanto, lo normal es a menudo la distribución predeterminada a considerar si no hay una razón para creer que no será una aproximación razonable. Aunque con las computadoras modernas ahora es más fácil usar herramientas no paramétricas u otras y no necesitamos depender tanto de lo normal (pero el historial / inercia / etc. nos mantiene usando métodos basados en lo normal).
Si eleva al cuadrado una variable que proviene de una distribución normal estándar, entonces sigue una distribución Chi-cuadrado. Si sumas variables de un Chi-cuadrado, obtienes otro Chi-cuadrado (cambio de grados de libertad), lo que significa que la varianza (escalada) sigue a un Chi-cuadrado.
También funciona que una función de la razón de probabilidad sigue una distribución Chi-cuadrado asintóticamente si el nulo es verdadero y se cumplen otros supuestos.
Una normal estándar dividida por la raíz cuadrada de un chi-cuadrado (y algunos parámetros de escala) sigue una distribución t, por lo que el estadístico t común (bajo la hipótesis nula) sigue a la t.
La relación de 2 Chis-cuadrados (dividida por grados de libertad y otras consideraciones) sigue una distribución F. Las pruebas de anova F se basan en la razón de 2 estimaciones de la misma varianza (debajo de la nula) y dado que las variaciones siguen un Chi-cuadrado, la razón sigue una F (bajo la retención de nulos y supuestos).
Las personas inteligentes elaboraron estas reglas para que el resto de nosotros podamos aplicarlas. Un curso completo de matemática / estadística dará más de la historia y las derivaciones (y posiblemente más de las alternativas), esto fue solo una descripción general rápida de las pruebas y distribuciones más comunes.
Una forma diferente de responder a su pregunta es el siguiente pensamiento secuencial que me gustaría ilustrar con un ejemplo simple:
1) ¿Cuál es la hipótesis nula relacionada con la pregunta de interés? Por ejemplo, en los Estados Unidos, el ingreso promedio es de $ 6000 por mes.
2) ¿Cómo podemos medir la desviación de la hipótesis nula en función de los datos disponibles? Primer intento: Ingreso promedio. Cuanto más lejos de 6000, menos plausible es la hipótesis nula y más debemos rechazarla.
3) Encuentre la distribución de si la hipótesis nula es verdadera. Esta "distribución nula" es la base para la decisión de la prueba. En nuestro ejemplo, si la muestra es grande, el Teorema del límite central nos dice que está aproximadamente distribuido normalmente con una media de 6000 y una desviación estándar , donde es la verdadera desviación estándar del ingreso en los EE. UU. . Sabemos que y pueden estimarse mediante la desviación estándar de la muestra .
Principalmente, ahora podríamos reclinarnos y usar este resultado para encontrar decisiones de prueba. Sin embargo, debido a que los estadísticos somos buenos, generalmente intentamos modificar el estadístico de prueba para mantener la distribución nula libre de la mayor cantidad de información dependiente de datos posible. En nuestro ejemplo simple, podríamos utilizar en lugar de . Esta estadística de prueba modificada es siempre aproximadamente normal normal si la hipótesis nula es verdadera. No importa el tamaño de la muestra, la media hipotética y la desviación estándar, la decisión de la prueba siempre se basa en los mismos valores críticos (como ). Esta es la famosa prueba Z de una muestra.
Solo hay tres distribuciones basadas en la realidad. (1) El binomio (2) El multinomial (3) El aproximador de Abraham De Moivre al binomio. Las otras distribuciones son expresiones 'derivadas' con un rango dinámico muy limitado y muy poco contacto con la realidad. Ejemplo. Un estadístico le dirá que sus datos se ajustan a una distribución de Poisson. Él realmente creerá que la distribución de Poisson tiene algún tipo de realidad 'independiente'. La verdad es que la distribución de Poisson se aproxima al binomio para cantidades muy pequeñas y muy grandes de sesgo. Ahora que todos tenemos computadoras, no hay razón para recurrir a los aproximadores. Pero, lamentablemente, los viejos hábitos tardan en morir.