Esta pregunta trata sobre la estimación de puntajes de corte en un cuestionario de detección multidimensional para predecir un punto final binario, en presencia de escalas correlacionadas.
Me preguntaron sobre el interés de controlar las puntuaciones secundarias asociadas al diseñar puntajes de corte en cada dimensión de una escala de medición (rasgos de personalidad) que podrían usarse para la detección del alcoholismo. Es decir, en este caso particular, la persona no estaba interesada en ajustar las covariables externas (predictores), lo que lleva a un área (parcial) bajo la curva ROC ajustada por covariables, por ejemplo (1-2), pero esencialmente en otras puntuaciones del mismo cuestionario porque se correlacionan entre sí (por ejemplo, "impulsividad" con "búsqueda de sensaciones"). Equivale a construir un GLM que incluya en el lado izquierdo el puntaje de interés (para el cual buscamos un punto de corte) y otro puntaje calculado a partir del mismo cuestionario, mientras que en el lado derecho el resultado puede ser el estado de consumo.
Para aclarar (por solicitud de @robin), supongamos que tenemos puntajes, digamos (por ejemplo, ansiedad, impulsividad, neuroticismo, búsqueda de sensaciones), y queremos encontrar un valor de corte (es decir, "caso positivo" si , "caso negativo" de lo contrario) para cada uno de ellos. Por lo general, ajustamos otros factores de riesgo como el sexo o la edad cuando diseñamos dicho límite (mediante el análisis de la curva ROC). Ahora, ¿qué pasa con el ajuste de la impulsividad (IMP) en cuanto a género, edad y búsqueda de sensaciones (SS) ya que se sabe que SS se correlaciona con IMP? En otras palabras, tendríamos un valor de corte para IMP donde se eliminan los efectos de la edad, el sexo y el nivel de ansiedad.
Además de decir que un límite debe ser lo más simple posible, mi respuesta fue
Con respecto a las covariables, recomendaría estimar las AUC con y sin ajuste, solo para ver si aumenta el rendimiento predictivo. Aquí, sus covariables son simplemente otras puntuaciones secundarias definidas a partir del mismo instrumento de medición y nunca enfrenté tal situación (generalmente, me ajusto a factores de riesgo conocidos, como Edad o Género). [...] Además, dado que está interesado en cuestiones de pronóstico (es decir, la eficacia de la evaluación del cuestionario), también puede estar interesado en estimar el valor predictivo positivo (VPP, probabilidad de pacientes con resultados positivos de prueba que se clasifican correctamente) proporcionados puede clasificar las asignaturas como "positivas" o "negativas" en función de sus puntuaciones en su cuestionario. Nota, sin embargo,
¿Tiene una comprensión más profunda de esta situación particular, con un enlace a documentos relevantes cuando sea posible?
Referencias
- Janes, H y Pepe, MS (2008). Ajuste de covariables en estudios de marcadores de diagnóstico, detección o pronóstico: un concepto antiguo en un entorno nuevo . American Journal of Epidemiology , 168 (1): 89-97.
- Janes, H y Pepe, MS (2008). Acomodación de covariables en el análisis ROC . UW Biostatistics Working Paper Series , Paper 322.