Creo que esta es una muy buena pregunta; llega al corazón del polémico "problema" de pruebas múltiples que afecta a campos que van desde la epidemiología hasta la econometría. Después de todo, ¿cómo podemos sabemos si el significado que encontramos es falsa o no? ¿Qué tan cierto es nuestro modelo multivariable?
En términos de enfoques técnicos para compensar la probabilidad de publicar variables de ruido, estoy totalmente de acuerdo con 'whuber' en que usar una parte de su muestra como datos de entrenamiento y el resto como datos de prueba es una buena idea. Este es un enfoque que se discute en la literatura técnica, por lo que si se toma el tiempo, probablemente pueda encontrar algunas buenas pautas sobre cuándo y cómo usarlo.
Pero para atacar más directamente la filosofía de las pruebas múltiples, le sugiero que lea los artículos a los que me refiero a continuación, algunos de los cuales respaldan la posición de que el ajuste para las pruebas múltiples a menudo es perjudicial (poder de costos), innecesario e incluso puede ser una falacia lógica. . Por mi parte, no acepto automáticamente la afirmación de que nuestra capacidad de investigar un predictor potencial se reduce inexorablemente por la investigación de otro. La tasa de error Tipo 1 a nivel familiar puede aumentar a medida que incluimos más predictores en un modelo dado, pero siempre que no superemos los límites del tamaño de nuestra muestra, la probabilidad de error Tipo 1 para cada individuoel predictor es constante; y el control del error familiar no ilumina qué variable específica es el ruido y cuál no. Por supuesto, también hay contraargumentos convincentes.
Por lo tanto, siempre y cuando limite su lista de variables potenciales a aquellas que sean plausibles (es decir, hubieran conocido las vías hacia el resultado), el riesgo de espuria ya se maneja bastante bien.
Sin embargo, agregaría que un modelo predictivo no está tan preocupado por el "valor de verdad" de sus predictores como un modelo causal ; Puede haber una gran confusión en el modelo, pero siempre que expliquemos un gran grado de la variación, no nos preocuparemos demasiado. Esto facilita el trabajo, al menos en un sentido.
Salud,
Brenden, consultor bioestadístico
PD: es posible que desee hacer una regresión de Poisson inflada a cero para los datos que describe, en lugar de dos regresiones separadas.
- Perneger, TV ¿Qué hay de malo con los ajustes de Bonferroni ? BMJ 1998; 316: 1236
- Cook, RJ & Farewell, VT Consideraciones de multiplicidad en el diseño y análisis de ensayos clínicos . Diario de la sociedad estadística real , serie A 1996; Vol. 159, N ° 1: 93-110
- Rothman, KJ No se necesitan ajustes para comparaciones múltiples . Epidemiology 1990; Vol. 1, N ° 1: 43-46
- Marshall, JR Dragado de datos y notable . Epidemiology 1990; Vol. 1, N ° 1: 5-7
- Groenlandia, S. y Robins, JM Empirical-Bayes ajustes para comparaciones múltiples a veces son útiles . Epidemiology 1991; Vol. 2, N ° 4: 244-251