Tengo una pregunta con respecto a la técnica de arranque adecuada para usar con datos donde hay una agrupación fuerte.
Se me asignó la tarea de evaluar un modelo predictivo de efectos mixtos multivariados en los datos de reclamos de seguros al calificar el modelo de referencia actual en los datos de reclamos más recientes, para determinar qué tan bien el modelo predice qué episodios de atención contienen la mayor frecuencia de sesiones (superior Percentil 95). La sensibilidad, la especificidad y el valor predictivo positivo (VPP) se utilizarán para evaluar la efectividad del modelo.
Bootstrapping parece el camino correcto para construir intervalos de confianza para los porcentajes de sensibilidad, especificidad y VPP. Desafortunadamente, un arranque ingenuo no es apropiado dado que los datos de las reclamaciones están 1) correlacionados por el proveedor de atención, 2) agrupados en episodios de atención con visitas más frecuentes durante los meses anteriores en el episodio de atención (por lo que existe cierta autocorrelación). ¿Sería apropiada aquí una variación de la técnica de arranque de bloques móviles?
O tal vez un procedimiento de arranque de tres pasos funcionaría: 1) muestra con reemplazo de los distintos proveedores en los datos, luego 2) muestra con reemplazo de distintos episodios de atención por parte de proveedores seleccionados, luego 3) muestra con reemplazo de diferentes reclamos dentro de cada episodio seleccionado
¡Muchas gracias por las sugerencias!