El otro día tuve una consulta con un epidemiólogo. Ella es un MD con un título de salud pública en epidemiología y tiene muchos conocimientos estadísticos. Ella asesora a sus compañeros de investigación y residentes y los ayuda con cuestiones estadísticas. Ella entiende las pruebas de hipótesis bastante bien. Tenía un problema típico de comparar dos grupos para ver si había una diferencia en el riesgo relacionado con tener insuficiencia cardíaca congestiva (ICC). Ella probó la diferencia media en la proporción de sujetos que recibieron CHF. El valor p fue de 0.08. Luego también decidió mirar el riesgo relativo y obtuvo un valor p de 0.027. Entonces ella preguntó por qué uno es significativo y el otro no. Mirando el 95% de los intervalos de confianza de dos lados para la diferencia y la relación, vio que el intervalo de diferencia media contenía 0 pero el límite superior de confianza para la relación era menor que 1. Entonces, ¿por qué obtenemos resultados inconsistentes? Mi respuesta, aunque técnicamente correcta, no fue muy satisfactoria. Dije: "Estas son estadísticas diferentes y pueden dar resultados diferentes. Los valores p están en el área de importancia marginal. Esto puede suceder fácilmente". Creo que debe haber mejores formas de responder esto en términos simples a los médicos para ayudarlos a comprender la diferencia entre probar el riesgo relativo y el riesgo absoluto. En los estudios de epi, este problema surge mucho porque a menudo miran eventos raros en los que las tasas de incidencia para ambos grupos son muy pequeñas y los tamaños de muestra no son muy grandes. He pensado un poco en esto y tengo algunas ideas que compartiré. Pero primero me gustaría saber cómo algunos de ustedes manejarían esto. Sé que muchos de ustedes trabajan o consultan en el campo de la medicina y probablemente se han enfrentado a este problema. ¿Qué harías?