Una razón muy probable para la correlación de 2 variables es que sus cambios están vinculados a una tercera variable. Otras razones probables son el azar (si prueba suficientes variables no correlacionadas para la correlación, algunas mostrarán correlación) o mecanismos muy complejos que involucran múltiples pasos.
Ver http://tylervigen.com/ para ejemplos como este:
Para establecer con confianza la causalidad de A -> B, necesita un experimento en el que pueda controlar la variable A y no influir en las otras variables. Luego, mide si la correlación de A y B todavía existe si cambia su variable.
Para casi todas las aplicaciones prácticas, es casi imposible no influir también en otras variables (a menudo desconocidas), por lo tanto, lo mejor que podemos hacer es demostrar la ausencia de causalidad.
Para poder establecer una relación causal, comienza con la hipótesis de que 2 variables tienen una relación causal, utiliza un experimento para refutar la hipótesis y si fallas, puedes afirmar con cierto grado de certeza que la hipótesis es verdadera. Cuán alto debe ser su grado de certeza depende de su campo de investigación.
En muchos campos es común o necesario ejecutar 2 partes de su experimento en paralelo, una donde la variable A cambia y un grupo de control donde la variable A no cambia, pero el experimento es exactamente el mismo, por ejemplo, en caso de En la medicina, todavía clava a los sujetos con una aguja o hace que traguen pastillas. Si el experimento muestra correlación entre A y B, pero no entre A y B '(B del grupo de control), puede asumir la causalidad.
También hay otras formas de concluir la causalidad, si un experimento no es posible o no es aconsejable por varias razones (moral, ética, relaciones públicas, costo, tiempo). Una forma común es usar la deducción. Tomando un ejemplo de un comentario: para probar que fumar causa cáncer en humanos, podemos usar un experimento para probar que fumar causa cáncer en ratones, luego demostrar que existe una correlación entre fumar y cáncer en humanos, y deducir que, por lo tanto, es extremadamente Es probable que el tabaquismo cause cáncer en los seres humanos: esta prueba se puede fortalecer si también refutamos que el cáncer causa el tabaquismo. Otra forma de concluir la causalidad es la exclusión de otras causas de la correlación, dejando la causalidad como la mejor explicación restante de la correlación: este método no siempre es aplicable, porque a veces es imposible eliminar todas las causas posibles de la correlación (llamadas "rutas de acceso" en otra respuesta). En el ejemplo de fumar / cáncer, probablemente podríamos usar este enfoque para demostrar que fumar es responsable del alquitrán en los pulmones, porque no hay muchas fuentes posibles para eso.
Estas otras formas de "probar" la causalidad no siempre son ideales desde un punto de vista científico, porque no son tan concluyentes como un experimento más simple. El debate sobre el calentamiento global es un gran ejemplo para mostrar cómo es mucho más fácil descartar la causalidad que aún no se ha demostrado de manera concluyente con un experimento repetible.
Para el alivio cómico, aquí hay un ejemplo de un experimento que es técnicamente plausible, pero no aconsejable debido a razones no científicas (moral, ética, relaciones públicas, costo):