¿Cómo abordan las variables instrumentales el sesgo de selección?

Me pregunto cómo una variable instrumental aborda el sesgo de selección en la regresión.

Este es el ejemplo que estoy analizando : en Econometría en su mayoría inofensiva , los autores discuten una regresión IV relacionada con el servicio militar y las ganancias más adelante en la vida. La pregunta es: "¿Servir en el ejército aumenta o disminuye las ganancias futuras?" Investigan esta pregunta en el contexto de la guerra de Vietnam. Entiendo que el servicio militar no puede asignarse al azar, y que este es un problema para la inferencia causal.

Para abordar este problema, el investigador utiliza la elegibilidad de borrador (como en "se llama a su número de borrador") como un instrumento para el servicio militar real. Eso tiene sentido: el borrador de Vietnam asignó aleatoriamente a jóvenes estadounidenses a las fuerzas armadas (en teoría, si los reclutas en realidad respondieron a mi pregunta). Nuestra otra condición IV parece sólida: la elegibilidad del draft y el servicio militar real están fuertemente correlacionados positivamente.

Aquí está mi pregunta. Parece que obtendría un sesgo de autoselección: tal vez los niños más ricos puedan dejar de servir en Vietnam, incluso si se llaman sus números de draft. (Si ese no fuera realmente el caso, pretendamos por el bien de mi pregunta). Si esta autoselección crea un sesgo sistémico dentro de nuestra muestra, ¿cómo aborda nuestra variable instrumental este sesgo? ¿Debemos reducir nuestro alcance de inferencia a "los tipos de personas que no pudieron escapar del borrador?" ¿O el IV salva de alguna manera esa parte de nuestra inferencia? Si alguien pudiera explicar cómo funciona esto, estaría muy agradecido.

— ConfundidoEconometría
fuente

En realidad, el tema del sesgo de selección es la motivación inicial para usar instrumentos. La pregunta aquí es si el sorteo de la lotería al azar soluciona este problema. Tiene toda la razón al preguntar: ¿cuáles son las limitaciones de este instrumento? Si de hecho los niños ricos tuvieran mejores oportunidades de evitar el borrador, entonces el efecto negativo del servicio en las ganancias posteriores se sobreestimará en términos absolutos.

Había otras formas de salir del borrador, por ejemplo debido a la mala salud. O, por el contrario, se sabía entre los reclutas potenciales que el voluntariado en lugar de ser reclutado por la lotería resultó en mejores ubicaciones y condiciones de servicio. Por lo tanto, las personas con números de lotería que tenían más probabilidades de ser reclutados a menudo optaron por ser voluntarios. Si tal comportamiento de evitación socava el proceso de aleatorización de la manera que usted describe, entonces nuestras estimaciones de 2SLS seguirán siendo sesgadas. Limitar la muestra a aquellos que no escaparon del borrador no le ayuda en este caso porque la aleatorización del tratamiento nuevamente no es realmente aleatoria.
Sin embargo, si el incumplimiento del tratamiento sigue siendo aleatorio o no es significativo en promedio, los números de la lotería aún pueden usarse como un instrumento. En este caso, su instrumento para el servicio militar es la intención de tratar (ITT, consulte el capítulo correspondiente en el libro de Angrist y Pischke). Entonces, el punto importante es que si hay incumplimiento debido a cualquier razón, debemos demostrar que esto no invalida la aleatorización. Entonces este instrumento está bien, de lo contrario no podemos usarlo.

Hay un par de formas de probar esto. Podrías hacer retroceder el instrumento $Z_i$ sobre características personales que no se ven afectadas por el tratamiento $D_i$ como edad, raza, etc., que se determinan antes $D_i$ está determinado. Otra comprobación es probar el efecto del instrumento sobre el resultado en muestras sin relación entre $D_i$ y $Z_i$ , como los voluntarios que se ofrecieron antes de recibir un borrador del número de lotería. La idea es que si la única razón por la cual su número de lotería afecta sus ganancias posteriores es a través del estado del servicio, entonces la elegibilidad del borrador no debería tener efecto en las ganancias en muestras donde no está relacionado con el estado del servicio.

Angrist (1990) realiza algunos de estos controles para abordar su inquietud. A pesar de las preocupaciones planteadas anteriormente, resulta que el proyecto de lotería parece ser un instrumento sólido. Berinsky (2010) proporciona muchas más comprobaciones de aleatorización y brinda más información básica sobre el historial de la lotería.

— Andy
fuente

¡Buena respuesta! El coro de la canción Draft Dodger Rag de Phil Ochs enumera los posibles mecanismos para evitar el borrador. Siempre pensé que verificar esto habría sido un trabajo divertido.

— Dimitriy V. Masterov 01 de

¡Gracias! Eso hace que todo sea mucho más claro; También leeré los periódicos.

— ConfusedEconometricsUndergrad