Tengo un conjunto de datos médicos con aproximadamente 200 variables. Una de las variables es un marcador biológico (concentración de una enzima particular). Su distribución es correcta, y el problema es que los valores por encima de cierto nivel están censurados / cortados en ese nivel. Entonces, mientras que la media de la variable es de alrededor de 10, cualquier valor mayor que 50 se registra como 50.
Me gustaría imputar valores continuos para esos valores censurados. Actualmente estoy usando la imputación múltiple con el paquete de ratones en R, aunque tengo otros sistemas disponibles y estoy abierto a otros enfoques. Un pensamiento que tuve fue recodificar todos esos valores censurados que faltaban y luego ejecutar las imputaciones. Si alguno de los valores imputados que originalmente fueron censurados está por debajo del límite, entonces se les asignará el valor límite.
Me gustaría saber opiniones sobre esto, y / o cualquier otro método mejor para lidiar con esto.