Entiendo la intuición detrás del MCP, pero tengo problemas para determinar exactamente la causa, qué es lo que debe evitarse, o al menos explicarse.
En su definición más contundente, estoy de acuerdo en que si tomo algún dato y le aplico un enfoque de fuerza bruta intentando todas las hipótesis nulas posibles, eventualmente encontraré una que pueda ser rechazada con un alfa arbitrario (por ejemplo, 5%) y declare un descubrimiento.
Pero en muchas definiciones de MCP leo algo como "cuanto más pruebas, más probabilidades hay de encontrar", y aunque estoy de acuerdo, no necesariamente lo veo como un problema (o al menos la raíz del problema). Por ejemplo, si muchos investigadores están analizando el mismo fenómeno con los mismos datos disponibles, cada uno probando su propia hipótesis, es más probable que uno llegue a un descubrimiento (que si fuera solo un investigador), eso significa que deberían estar aplicando algún tipo de corrección a su alfa objetivo (por ejemplo, una corrección de Bonferroni )? Supongo que la respuesta es no, pero luego no queda claro por qué un solo investigador que prueba muchas hipótesis debería (nuevamente, está de acuerdo en que se puede abusar del sistema de prueba y que debe haber una corrección para eso).
¿Cuándo se convierte en un problema esta mayor posibilidad de encontrar un descubrimiento (rechazar una hipótesis nula)? Al pensar en las causas, hay algunos factores que me vienen a la mente, pero no estoy seguro de cuál de ellos (u otros que no figuran aquí) está más relacionado con la causa de este problema:
Análisis post hoc : entiendo que las hipótesis deben (preferiblemente) formularse a priori, si no, solo estoy mirando los datos tratando de adivinar qué hipótesis podría encajar bajo el alfa deseado.
Reutilización de datos: ¿desaparece el problema si uso diferentes conjuntos de datos para cada hipótesis que pruebo? La posibilidad de encontrar un descubrimiento aún aumentará a medida que más hipótesis pruebo (incluso en diferentes conjuntos de datos).
Investigadores independientes: reutilizando el ejemplo anterior, ¿el MCP está relacionado con el mismo equipo / esfuerzo de investigación? ¿O se aplica a múltiples investigadores independientes que trabajan en el mismo problema (o incluso en los mismos datos o datos similares)?
Hipótesis independientes: en relación con el tema anterior, ¿surge el problema (o se manifiesta más fuertemente) cuando las hipótesis son independientes? (porque estoy cubriendo más del espacio de búsqueda) o el problema principal es probar hipótesis similares con pequeñas variaciones (por ejemplo, ajustar un parámetro)?
Podría resumir los puntos anteriores, en mi interpretación, como (1) y (2) son formas de reducir el espacio de búsqueda (tomando prestada la terminología de la teoría de optimización) donde estoy haciendo que sea más fácil encontrar un descubrimiento; y (3) y (4) como el uso de más métodos de búsqueda ortogonales que cubren más de este espacio de búsqueda cada vez que se aplican (es decir, cada vez que se prueba una hipótesis). Pero estas son solo algunas de las posibles causas que podría plantear, para ayudar a obtener una respuesta, hay mucho más que me estoy perdiendo, estoy seguro.
Esta pregunta es algo así como una continuación de una anterior que pregunta por qué la comparación múltiple es un problema , planteando un problema similar a la distinción entre el FWER y el FDR (si entiendo la pregunta correctamente). En esta pregunta, no considero que sea un problema (aunque estaría más inclinado a usar FDR), ambas tasas implican que hay un problema al analizar más de una hipótesis (pero no veo la distinción del caso cuando Analizo diferentes problemas no relacionados, encontrando un descubrimiento para cada uno de ellos con un 5% de significancia, lo que significa que cuando haya "resuelto" 100 problemas rechazando hipótesis nulas, 5 de ellos (valor esperado) probablemente estarían equivocados). La mejor respuesta a esa pregunta. implicaba que no había una respuesta definitiva, y tal vez tampoco haya una para esta pregunta, pero aún sería muy útil (al menos para mí) dilucidar lo más posible dónde está la causa del error de MCP procedente de.
( Otra respuesta a la misma pregunta sugirió un documento que explica los beneficios de la perspectiva del modelo multinivel bayesiano sobre la perspectiva clásica. Este es otro enfoque interesante que vale la pena investigar, pero el alcance de esta pregunta es el marco clásico).
Ya hay varias preguntas sobre este problema, muchas de las cuales vale la pena leer (por ejemplo, 1 , 2 , 3 , 4 ) que abordan (desde diferentes perspectivas) los problemas planteados anteriormente, pero aún siento una respuesta más unificada (si eso es posible) falta, de ahí esta pregunta, que espero no disminuya la (ya problemática) SNR .