Tengo los resultados de una prueba de sangre administrada a 2500 personas cuatro veces a intervalos de seis meses. Los resultados consisten principalmente en dos medidas de respuesta inmune: una en presencia de ciertos antígenos de tuberculosis y otra en ausencia. Actualmente, cada prueba se evalúa como positiva o negativa en función de la diferencia entre la respuesta al antígeno y la respuesta nula (con la idea de que si su sistema inmunitario responde a los antígenos de la TB, es probable que haya estado expuesto a la bacteria en algún momento) ) En esencia, la prueba supone que las distribuciones de un individuo no expuesto de respuestas nulas y de TB deben ser básicamente idénticas, mientras que una persona con exposición a TB tendrá respuestas de TB de una distribución diferente (de valores más altos). Consideración: las respuestas son muy, muy no normales, y los valores se agrupan tanto en el piso natural como en el techo truncado por instrumentos.
Sin embargo, parece bastante claro en esta configuración longitudinal que estamos obteniendo "falsos positivos" (no hay un estándar de oro real para la tuberculosis latente, me temo) que son causados por fluctuaciones (típicamente pequeñas) en el antígeno y respuestas nulas. Si bien esto puede ser difícil de evitar en algunas situaciones (es posible que solo tenga una oportunidad de evaluar a alguien), hay muchas situaciones en las que a las personas se les realizan pruebas de detección de tuberculosis de forma rutinaria cada año más o menos; en los EE. UU. los militares, las personas sin hogar que se alojan en refugios, etc. Parece una pena ignorar los resultados de las pruebas anteriores porque los criterios existentes resultan ser transversales.
Yo creo que lo que me gustaría hacer es lo que crudamente conciben como el análisis de mezclas longitudinal. Al igual que los criterios transversales, me gustaría poder estimar la probabilidad de que las respuestas de TB y nulas de un individuo se extraigan de la misma distribución, pero que esa estimación incorpore resultados de pruebas anteriores, así como información de la muestra como un todo (p. ej., ¿puedo usar la distribución de toda la muestra de las variabilidades dentro de cada individuo para mejorar mis estimaciones de la distribución de nulo o TB de un individuo específico?). La probabilidad estimada necesitaría poder cambiar con el tiempo, por supuesto, para tener en cuenta la posibilidad de una nueva infección.
Me he vuelto totalmente loco tratando de pensar en esto de maneras inusuales, pero siento que esta conceptualización es tan buena como cualquiera que se me ocurra. Si algo no tiene sentido, no dude en solicitar una aclaración. Si mi comprensión de la situación parece incorrecta, no dude en decirme. Muchas gracias por tu ayuda.
En respuesta a Srikant: Es un caso de clasificación latente (infectada o no con TB) usando los dos resultados de prueba continuos (pero no normales y truncados). En este momento, esa clasificación se realiza utilizando un punto de corte (en su forma simplificada, TB - nulo> .35 -> positivo). Con los resultados de la prueba presentados como (nulo, TB, resultado), los arquetipos básicos * son:
Probable Negativo: (0.06, 0.15, -) (0.24, 0.23, -) (0.09, 0.11, -) (0.16, 0.15, -)
Positivo Positivo: (0.05, 3.75, +) (0.05, 1.56, +) (0.06 , 5.02, +) (0.08, 4.43, +)
Wobbler: (0.05, 0.29, -) (0.09, 0.68, +) (0.08, 0.31, -) (0.07, 0.28, -)
Lo positivo en la segunda prueba para el Wobbler es claramente una aberración, pero ¿cómo modelarías eso? Si bien una línea de mi pensamiento es estimar la "verdadera diferencia" entre TB y cero en cada punto de tiempo utilizando un modelo multinivel de medidas repetidas, se me ocurrió que lo que realmente quiero saber es si la respuesta de la persona es nula y la respuesta de TB se extraen de la misma distribución, o si su sistema inmunitario reconoce los antígenos de TB y se activa, produciendo una mayor respuesta.
En cuanto a lo que podría causar una prueba positiva además de la infección: no estoy seguro. Sospecho que generalmente es solo una variación dentro de la persona en los resultados, pero ciertamente existe la posibilidad de otros factores. Tenemos cuestionarios de cada momento, pero todavía no los he examinado demasiado.
* Datos fabricados pero ilustrativos