Estoy tratando de entender cómo podría modelar mejor una variable donde con el tiempo obtuve predictores cada vez más detallados. Por ejemplo, considere modelar las tasas de recuperación de los préstamos en mora. Supongamos que tenemos un conjunto de datos con 20 años de datos, y en los primeros 15 de esos años solo sabemos si el préstamo estaba garantizado o no, pero nada sobre las características de esa garantía. Sin embargo, durante los últimos cinco años, podemos dividir la garantía en un rango de categorías que se espera que sean un buen predictor de la tasa de recuperación.
Dada esta configuración, quiero ajustar un modelo a los datos, determinar medidas como la significación estadística de los predictores y luego pronosticar con el modelo.
¿En qué marco de datos faltantes encaja esto? ¿Hay alguna consideración especial relacionada con el hecho de que las variables explicativas más detalladas solo están disponibles después de un momento dado, en lugar de estar dispersas en la muestra histórica?