Estoy haciendo una regresión de riesgos proporcionales de Cox en R usando coxph
, que incluye muchas variables. Los residuos de Martingala se ven geniales, y los residuos de Schoenfeld son excelentes para CASI TODAS las variables. Hay tres variables cuyos residuos de Schoenfeld no son planos, y la naturaleza de las variables es tal que tiene sentido que puedan variar con el tiempo.
Estas son variables que realmente no me interesan, por lo que estarlas en estratos estaría bien. Sin embargo, todas ellas son variables continuas, no variables categóricas. Entonces percibo que los estratos no son una ruta viable *. He intentado construir interacciones entre las variables y el tiempo, como se describe aquí , pero obtenemos el error:
In fitter(X, Y, strats, offset, init, control, weights = weights, :
Ran out of iterations and did not converge
Estoy trabajando con casi 1000 puntos de datos, y estoy trabajando con media docena de variables con muchos factores cada una, por lo que parece que estamos empujando los límites de cómo estos datos se pueden dividir y cortar en cubitos. Desafortunadamente, todos los modelos más simples que he probado con menos variables incluidas son claramente peores (por ejemplo, los residuos de Schoenfeld son más complicados para más variables).
¿Cuáles son mis opciones? Como no me importan estas variables particulares de mal comportamiento, me gustaría ignorar su salida, ¡pero sospecho que no es una interpretación válida!
* Uno es continuo, uno es un número entero con un rango de más de 100 y uno es un número entero con un rango de 6. ¿Quizás binning?