Ahora tengo datos de un país africano sobre (i) niveles de corrupción en los sectores públicos y (ii) percepciones de la calidad del servicio de los hogares (malo, medio y alto). Los datos consisten en dos tipos de hogares: los que han utilizado los servicios públicos y los que NO.
He leído varios artículos de algunas revistas respetadas (World Development, Journal of Development Economics) que abordan el problema del sesgo de selectividad: aquellos que no se han dedicado a los servicios públicos podrían hacerlo porque sabían que tendrían que sobornar (corrupción) o tenían una mala experiencia del pasado y terminarían sintiéndose mal.
Sin embargo, los autores de los artículos no utilizan modelos de Heckit, que he aprendido de mi título. En cambio, argumentan que al ejecutar dos regresiones: (i) usar datos sobre aquellos que realmente usaron los servicios y (ii) todos los hogares de la muestra, independientemente del uso del servicio. Siento que este enfoque no es correcto.
Deseo comprender mejor cómo se debe manejar el sesgo de selección, particularmente en este ejemplo. Algunos problemas con los datos son que los datos pueden ser subjetivos, bastante pequeños (alrededor de 500 hogares) y propensos a errores de medición. ¿Tiene alguna sugerencia para lidiar con los problemas?
Muchas gracias.