Estaba leyendo este artículo en Nature en el que se explican algunas falacias en el contexto del análisis de datos. Noté que la falacia del tirador de Texas era particularmente difícil de evitar:
La fábula del francotirador de Texas ilustra una trampa cognitiva que espera durante el análisis de datos: un tirador inepto que dispara un patrón aleatorio de balas al costado de un granero, dibuja un objetivo alrededor del mayor grupo de agujeros de bala y señala con orgullo a Su éxito.
Su tiro al blanco es obviamente ridículo, pero la falacia no es tan obvia para los jugadores que creen en una 'mano caliente' cuando tienen una racha de victorias, o para las personas que ven un significado sobrenatural cuando aparece un sorteo de lotería como números impares.
Tampoco es siempre obvio para los investigadores. "Simplemente obtienes algo de aliento de los datos y luego piensas, bueno, este es el camino a seguir", dice Pashler. “No se da cuenta de que tenía 27 opciones diferentes y eligió la que le dio los resultados más agradables o interesantes, y ahora está involucrado en algo que no es en absoluto una representación imparcial de los datos. "
Creo que ese tipo de trabajo de exploración es común y, a menudo, las hipótesis se construyen en función de esa parte del análisis. Hay un enfoque completo ( EDA ) dedicado a este proceso:
El análisis exploratorio de datos fue promovido por John Tukey para alentar a los estadísticos a explorar los datos, y posiblemente formular hipótesis que podrían conducir a la recopilación de nuevos datos y experimentos.
Parece que cualquier proceso exploratorio realizado sin tener una hipótesis previa es propenso a generar hipótesis espurias.
Tenga en cuenta que la descripción de EDA anterior realmente habla new data collection and experiments
. Entiendo que después de que se hayan recopilado nuevos datos, es apropiado un análisis de datos confirmatorio (CDA). Sin embargo, no creo que esta distinción se haga con mucha claridad, y aunque una separación de EDA y CDA sería ideal, seguramente hay algunas circunstancias en las que esto no es factible. Diría que seguir esta separación estrictamente es poco común y la mayoría de los profesionales no se suscriben al paradigma EDA.
Entonces mi pregunta es: ¿EDA (o algún proceso informal de exploración de datos) hace que sea más probable que caiga en la falacia del tirador de Texas?