Estoy viendo algunos problemas, y en algunos, para probar los coeficientes, a veces veo personas que usan la distribución de Student, y a veces veo la distribución Normal. Cual es la regla
Estoy viendo algunos problemas, y en algunos, para probar los coeficientes, a veces veo personas que usan la distribución de Student, y a veces veo la distribución Normal. Cual es la regla
Respuestas:
La distribución normal es la distribución de muestra grande en muchos problemas estadísticos significativos que involucran alguna versión del Teorema del límite central: tiene (aproximadamente) piezas independientes de información que se suman para llegar a la respuesta. Si las estimaciones de los parámetros son asintóticamente normales, sus funciones también serán asintóticamente normales (en casos regulares).
Por otro lado, la distribución Student se deriva en condiciones más restrictivas de errores de regresión normales. Si puede comprar esta suposición, puede comprar la distribución se usa para probar hipótesis en regresión lineal. El uso de esta distribución proporciona intervalos de confianza más amplios que el uso de la distribución normal. El significado sustantivo de esto es que en muestras pequeñas, debe estimar su medida de incertidumbre, el error cuadrático medio de regresión o la desviación estándar de los residuos, . (En muestras grandes, tiene tanta información como si la supiera, por lo que la distribución degenera en la distribución normal).
Hay algunas ocasiones en la regresión lineal, incluso con muestras finitas, donde la distribución de Student no puede justificarse. Están relacionados con violaciones de las condiciones de segundo orden en errores de regresión; a saber, que son (1) varianza constante y (2) independientes. Si se violan estos supuestos y corrige sus errores estándar utilizando el estimador Eicker / White para residuos heterocedasticos, pero independientes; o estimador de Newey-West para errores correlacionados en serie o errores estándar agrupadospara los datos correlacionados por el clúster, no hay forma de obtener una justificación razonable para la distribución de Estudiantes. Sin embargo, al emplear una versión adecuada del argumento de normalidad asintótica (matrices traingulares y demás), puede justificar la aproximación normal (aunque debe tener en cuenta que sus intervalos de confianza probablemente sean demasiado estrechos).
Me gusta la representación de la distribución t de Student como una mezcla de una distribución normal y una distribución gamma:
Tenga en cuenta que la media de la distribución gamma es y la varianza de esta distribución es . Por lo tanto, podemos ver la distribución t como una generalización del supuesto de varianza constante a un supuesto de varianza "similar". básicamente controla cuán similares permitimos que sean las variaciones. También puede ver esto como una regresión "aleatoria ponderada", ya que podemos usar la integral anterior como una representación de "variable oculta" de la siguiente manera:
Donde y todas las variables son independientes. De hecho, esto es básicamente la definición de la distribución t, como
Puede ver por qué este resultado hace que la distribución t de Student sea "robusta" en comparación con la normal porque puede ocurrir un error grande debido a un valor grande de o debido a un valor pequeño de . Ahora porque es común a todas las observaciones, pero es específico de la i-ésima, lo que el "sentido común" general para concluir es que los valores atípicos dan evidencia de pequeños . Además, si tuviera que hacer una regresión lineal , encontrará que es el peso de la i-ésima observación, suponiendo que se :σ 2 ρ i σ 2 ρ i ρ i μ i = x T i β ρ i ρ i
Entonces, un valor atípico constituye evidencia de pequeño que significa que la i-ésima observación tiene menos peso. Además, un pequeño "valor atípico", una observación que se predice / ajusta mucho mejor que el resto, constituye evidencia de un gran . Por lo tanto, esta observación tendrá más peso en la regresión. Esto está en línea con lo que uno haría intuitivamente con un valor atípico o un buen punto de datos.ρ i
Tenga en cuenta que no hay una "regla" para decidir estas cosas, aunque la respuesta mía y de otros a esta pregunta puede ser útil para encontrar algunas pruebas que puede hacer a lo largo de la ruta de variación finita (la t de estudiante es una variación infinita para grados de libertad menores o iguales) para dos).