Los términos endogeneidad y heterogeneidad no observada a menudo se refieren a lo mismo, pero el uso varía un poco, incluso dentro de la economía, la disciplina que más asocio con los términos.
En una ecuación de regresión, una variable explicativa es endógena. si está correlacionada con el término de error.
A menudo se describe que la endogeneidad tiene tres fuentes: variables omitidas, error de medición y simultaneidad. Aunque a menudo es útil mencionar estas "fuentes" por separado, a veces surge confusión porque no son realmente distintas. Imagine una regresión que predice el efecto de la educación en los salarios. Quizás nuestra medida de educación es simplemente la cantidad de años que alguien pasó en educación formal, independientemente del tipo de educación. Si tengo una idea clara de qué tipo de educación afecta los salarios, podría describir esta situación como un error de medición en la variable de educación. Alternativamente, podría describir la situación como un problema de variables omitidas (las variables que indican el tipo de educación).
Quizás los salarios también afectan las decisiones educativas. Si los salarios y la educación se miden al mismo tiempo, este es un ejemplo de simultaneidad, pero también podría reformularse en términos de variables omitidas.
La heterogeneidad no observada es simplemente variación / diferencias entre casos que no se miden. Si comprende la endogeneidad, creo que comprende las implicaciones de la heterogeneidad no observada en un contexto de regresión.