Su caso es menos problemático que al revés. Las expectativas y los operadores de proyecciones lineales pasan por una primera etapa lineal (por ejemplo, OLS) pero no por etapas no lineales como probit o logit. Por lo tanto, no es un problema si primero regresa su variable endógena continua en su (s) instrumento (s) ,
X_i = a + Z'_i \ pi + \ eta_i
y luego usa los valores ajustados en una segunda etapa probit para estimar
\ text { Pr} (Y_i = 1 | \ widehat {X} _i) = \ text {Pr} (\ beta \ widehat {X} _i + \ epsilon_i> 0)XZ
Xyo= a + Z′yoπ+ ηyo
Pr ( Yyo= 1 |Xˆyo) = Pr ( βXˆyo+ ϵyo> 0 )
Los errores estándar no serán correctos porque Xˆyo no es una variable aleatoria sino una cantidad estimada. Puede corregir esto iniciando juntos la primera y la segunda etapa juntas. En Stata esto sería algo así como
// use a toy data set as example
webuse nlswork
// set up the program including 1st and 2nd stage
program my2sls
reg grade age race tenure
predict grade_hat, xb
probit union grade_hat age race
drop grade_hat
end
// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls
En este ejemplo, queremos estimar el efecto de años de educación sobre la probabilidad de estar en un sindicato. Dado que es probable que los años de educación sean endógenos, lo instrumentamos con años de permanencia en la primera etapa. Por supuesto, esto no tiene ningún sentido desde el punto de vista de la interpretación, pero ilustra el código.
Solo asegúrese de utilizar las mismas variables de control exógeno en la primera y segunda etapa. En el ejemplo anterior, esos son age, race
mientras que el instrumento (no sensorial) tenure
solo está allí en la primera etapa.