Soy un estudiante de doctorado en psicología experimental y me esfuerzo por mejorar mis habilidades y conocimientos sobre cómo analizar mis datos.
Hasta mi quinto año en psicología, pensé que los modelos de regresión (por ejemplo, ANOVA) suponen lo siguiente:
- normalidad de los datos
- homogeneidad de varianza para los datos, etc.
Mis cursos de pregrado me llevan a creer que las suposiciones se referían a los datos. Sin embargo, en mi quinto año, algunos de mis instructores subrayaron el hecho de que los supuestos se refieren al error (estimado por los residuos) y no a los datos sin procesar.
Recientemente estuve hablando sobre la pregunta de los supuestos con algunos de mis colegas que también admitieron que descubrieron la importancia de verificar los supuestos sobre el residuo solo en sus últimos años de universidad.
Si entiendo bien, los modelos de regresión hacen suposiciones sobre el error. Por lo tanto, tiene sentido verificar los supuestos sobre los residuos. Si es así, ¿por qué algunas personas verifican los supuestos sobre los datos sin procesar? ¿Es porque dicho procedimiento de verificación se aproxima a lo que obtendríamos al verificar el residual?
Me interesaría mucho en una discusión sobre este tema con algunas personas que tienen un conocimiento más preciso que mis colegas y yo. Les agradezco de antemano sus respuestas.