En Pensamiento, rápido y lento , Daniel Kahneman plantea la siguiente pregunta hipotética:
(P. 186) Julie actualmente es estudiante de último año en una universidad estatal. Leía con fluidez cuando tenía cuatro años. ¿Cuál es su promedio de calificaciones (GPA)?
Su intención es ilustrar cómo a menudo no tenemos en cuenta la regresión a la media al hacer predicciones sobre ciertas estadísticas. En la discusión posterior, aconseja:
(P. 190) Recuerde que la correlación entre dos medidas (en el presente caso, edad de lectura y GPA) es igual a la proporción de factores compartidos entre sus determinantes. ¿Cuál es su mejor suposición sobre esa proporción? Mi suposición más optimista es alrededor del 30%. Suponiendo esta estimación, tenemos todo lo que necesitamos para producir una predicción imparcial. Aquí están las instrucciones sobre cómo llegar en cuatro pasos simples:
- Comience con una estimación del promedio de GPA.
- Determine el promedio de calificaciones que coincida con su impresión de la evidencia.
- Estime la correlación entre la precocidad de lectura y el GPA.
- Si la correlación es .30, mueva el 30% de la distancia del promedio al promedio de calificaciones correspondiente.
Mi interpretación de su consejo es la siguiente:
- Use "Leyó con fluidez cuando tenía cuatro años" para establecer un puntaje estándar para la precocidad de lectura de Julie.
- Determine un GPA que tenga un puntaje estándar correspondiente. (El GPA racional para predecir correspondería a este puntaje estándar si la correlación entre el GPA y la precocidad de lectura fuera perfecta).
- Calcule qué porcentaje de variaciones en el GPA puede explicarse por variaciones en la precocidad de lectura. (¿Asumo que se está refiriendo al coeficiente de determinación con "correlación" en este contexto?)
- Debido a que solo el 30% del puntaje estándar de la precocidad de lectura de Julie puede explicarse por factores que también pueden explicar el puntaje estándar de su GPA, solo estamos justificados para predecir que el puntaje estándar del GPA de Julie será el 30% de lo que sería en el caso de la correlación perfecta
¿Es correcta mi interpretación del procedimiento de Kahneman? Si es así, ¿hay una justificación matemática más formal de su procedimiento, especialmente el paso 4? En general, ¿cuál es la relación entre la correlación entre dos variables y los cambios / diferencias en sus puntajes estándar?