Además de la importante respuesta de Carlos Cinelli a esta pregunta, hay algunas razones más por las que los coeficientes de regresión podrían no ser causales.
En primer lugar, la especificación errónea del modelo puede hacer que los parámetros sean no causales. El hecho de que tenga todas las variables relevantes en su modelo no significa que las haya ajustado de la manera correcta. Como un ejemplo muy simple, considere una variable X que se distribuye simétricamente alrededor de 0. Suponga que su variable de resultado Y se ve afectada por X de tal manera que E(Y∣X)=X2 . La regresión de Y en X (a diferencia de en X2 ) dará un coeficiente estimado para Xde aproximadamente 0, claramente sesgado, a pesar de que teniendo en cuenta todos (el único) variable que afecta a Y .
En segundo lugar, y en relación con el tema de la causalidad inversa, también existe el riesgo de que pueda tener un sesgo de selección , es decir, que su muestra haya sido seleccionada de tal manera que no sea representativa de la población a la que desea hacer su inferencia. Además, los datos faltantes también pueden introducir un sesgo si los datos no faltan completamente al azar.