Me pregunto cómo una variable instrumental aborda el sesgo de selección en la regresión.
Este es el ejemplo que estoy analizando : en Econometría en su mayoría inofensiva , los autores discuten una regresión IV relacionada con el servicio militar y las ganancias más adelante en la vida. La pregunta es: "¿Servir en el ejército aumenta o disminuye las ganancias futuras?" Investigan esta pregunta en el contexto de la guerra de Vietnam. Entiendo que el servicio militar no puede asignarse al azar, y que este es un problema para la inferencia causal.
Para abordar este problema, el investigador utiliza la elegibilidad de borrador (como en "se llama a su número de borrador") como un instrumento para el servicio militar real. Eso tiene sentido: el borrador de Vietnam asignó aleatoriamente a jóvenes estadounidenses a las fuerzas armadas (en teoría, si los reclutas en realidad respondieron a mi pregunta). Nuestra otra condición IV parece sólida: la elegibilidad del draft y el servicio militar real están fuertemente correlacionados positivamente.
Aquí está mi pregunta. Parece que obtendría un sesgo de autoselección: tal vez los niños más ricos puedan dejar de servir en Vietnam, incluso si se llaman sus números de draft. (Si ese no fuera realmente el caso, pretendamos por el bien de mi pregunta). Si esta autoselección crea un sesgo sistémico dentro de nuestra muestra, ¿cómo aborda nuestra variable instrumental este sesgo? ¿Debemos reducir nuestro alcance de inferencia a "los tipos de personas que no pudieron escapar del borrador?" ¿O el IV salva de alguna manera esa parte de nuestra inferencia? Si alguien pudiera explicar cómo funciona esto, estaría muy agradecido.