Imagine que un investigador está explorando un conjunto de datos y ejecuta 1000 regresiones diferentes y encuentra una relación interesante entre ellos.
Ahora imagine que otro investigador con los mismos datos ejecuta solo 1 regresión, y resulta que es el mismo que el otro investigador tomó 1000 regresiones para encontrar. El investigador 2 no conoce al investigador 1.
¿Debería el investigador 1 hacer inferencias diferentes que el investigador 2? ¿Por qué? Por ejemplo, ¿debería el investigador 1 realizar correcciones de comparaciones múltiples, pero el investigador 2 no debería?
Si el investigador 2 le mostrara primero su regresión única, ¿qué inferencias haría? Si después de eso el investigador 1 le mostró sus resultados, ¿debería cambiar su inferencia? Si es así, ¿por qué debería importar?
PD 1 : si hablar de investigadores hipotéticos hace que el problema sea abstracto, piense en esto: imagine que ejecutó solo una regresión para su trabajo, utilizando el mejor método disponible. Luego, otro investigador exploró 1000 regresiones diferentes con los mismos datos, hasta que encontró exactamente la misma regresión que usted ejecutó . ¿Deberían ustedes dos hacer inferencias diferentes? ¿La evidencia es la misma para ambos casos o no? ¿Debería cambiar su inferencia si conociera los resultados del otro investigador? ¿Cómo debe evaluar el público la evidencia de los dos estudios?
PD 2: por favor, trate de ser específico y de proporcionar una justificación matemática / teórica, si es posible.