Tengo un conjunto de datos que analiza las solicitudes de inmigración y las aceptaciones de visas (otorgamiento de visas). Las tarifas se calculan para las solicitudes de visa "aceptadas" y "rechazadas".
Sin embargo, el conjunto de datos también tiene valores para los casos que se cerraron. Normalmente esto es cuando el inmigrante dejó de presentarse a las citas, emigró a otro lugar o murió. Debido a que estos números no se usan cuando se calculan las tasas, las tasas a menudo aparecen como faltantes (porque los casos no fueron aceptados ni rechazados).
Dicho esto, si los únicos casos para ese año estuvieran "cerrados de otra manera", ¿alguna vez estaría bien abandonar estas observaciones? Parte del problema que tengo es que los años aleatorios en el conjunto de datos se eliminarán, porque las únicas decisiones para ese año fueron cerradas.
Los casos cerrados de otra manera son muy arbitrarios, y como mencioné, probablemente sean casos en los que el inmigrante emigró a otro lugar, y probablemente solo utilizó el primer país como un lugar de tránsito temporal. Los datos no dicen específicamente por qué los inmigrantes se fueron, por qué fueron cerrados, etc. No estoy realmente seguro de cómo lidiar con estos valores perdidos. No creo que los métodos de imputación estándar funcionen aquí, debido a los cálculos de la tasa (pero podría estar equivocado).