Actualmente estoy trabajando con un gran conjunto de datos de reclamos de seguro de salud que incluye algunos reclamos de laboratorio y farmacia. Sin embargo, la información más consistente en el conjunto de datos está compuesta por códigos de diagnóstico (ICD-9CM) y de procedimiento (CPT, HCSPCS, ICD-9CM).
Mis objetivos son:
- Identificar las condiciones precursoras más influyentes (comorbilidades) para una afección médica como la enfermedad renal crónica;
- Identifique la probabilidad (o probabilidad) de que un paciente desarrolle una afección médica según las afecciones que haya tenido en el pasado;
- Haga lo mismo que 1 y 2, pero con procedimientos y / o diagnósticos.
- Preferiblemente, los resultados serían interpretables por un médico.
He examinado cosas como los documentos de Milestone del Premio Heritage Health y he aprendido mucho de ellos, pero se centran en predecir las hospitalizaciones.
Aquí están mis preguntas: ¿Qué métodos crees que funcionan bien para problemas como este? Y, ¿qué recursos serían más útiles para aprender sobre aplicaciones y métodos de ciencia de datos relevantes para la atención médica y la medicina clínica?
EDITAR # 2 para agregar tabla de texto sin formato:
CKD es la condición objetivo, "enfermedad renal crónica", ".any" denota que han adquirido esa condición en cualquier momento, ".isbefore.ckd" significa que tenían esa condición antes de su primer diagnóstico de CKD. Las otras abreviaturas corresponden con otras condiciones identificadas por agrupaciones de códigos ICD-9CM. Esta agrupación ocurre en SQL durante el proceso de importación. Cada variable, con la excepción de patient_age, es binaria.