Cuando (es decir, Y proviene del modelo de regresión lineal), ε ∼ N ( 0 , σ 2 I ) Y en ese caso los residuos e 1 , ... , e n están correlacionados y no independientes. Pero cuando hacemos diagnósticos de regresión y queremos probar la hipótesis de ε ~ N ( 0 , σ 2 I ) , los libros de texto sugiere utilizar parcelas Q-Q y pruebas estadísticas sobre residuos e que fueron diseñados para probar si e ~ N ( 0 , σ 2 I ) para algunos σ 2 ∈ R .
¿Por qué no importa para estas pruebas que los residuos estén correlacionados y no sean independientes? A menudo se sugiere para uso normalizado pero eso solo los hace homoscedastic, no independientes.
Para reformular la pregunta: los residuos de la regresión OLS están correlacionados. Entiendo que en la práctica, estas correlaciones son tan pequeñas (¿la mayoría de las veces? ¿Siempre?), Que pueden ignorarse al probar si los residuos provienen de una distribución normal. Mi pregunta es, ¿por qué?