Comprender la paradoja de Simpson: el ejemplo de Andrew Gelman con la regresión de los ingresos por sexo y altura


22

Andrew Gelman en una de sus publicaciones de blog recientes dice:

  1. No creo que sean necesarios hechos contrafactuales o posibles resultados para la paradoja de Simpson. Digo esto porque uno puede configurar la paradoja de Simpson con variables que no pueden ser manipuladas, o para las cuales las manipulaciones no son directamente de interés.

  2. La paradoja de Simpson es parte de un problema más general en el que los coeficientes de regresión cambian si agrega más predictores, el cambio de signo no es realmente necesario.

Aquí hay un ejemplo que uso en mi enseñanza que ilustra ambos puntos:

Puedo ejecutar una regresión que predice los ingresos por sexo y altura. Encuentro que el coeficiente de sexo es de $ 10,000 (es decir, al comparar a un hombre y una mujer de la misma altura, en promedio, el hombre ganará $ 10,000 más) y el coeficiente de estatura es de $ 500 (es decir, al comparar dos hombres o dos mujeres de diferentes alturas, en promedio, la persona más alta ganará $ 500 más por pulgada de altura).

¿Cómo puedo interpretar estos coeficientes? Siento que el coeficiente de altura es fácil de interpretar (es fácil imaginar comparar a dos personas del mismo sexo con diferentes alturas), de hecho, de alguna manera parecería "incorrecto" retroceder en altura sin controlar el sexo, ya que La diferencia entre las personas bajas y altas puede "explicarse" al ser diferencias entre hombres y mujeres. Pero el coeficiente de sexo en el modelo anterior parece muy difícil de interpretar: ¿por qué comparar un hombre y una mujer que miden 66 pulgadas de alto, por ejemplo? Eso sería una comparación de un hombre bajo con una mujer alta. Todo este razonamiento parece vagamente causal, pero no creo que tenga sentido pensar en ello utilizando resultados potenciales.

Reflexioné sobre ello (e incluso comenté en la publicación) y creo que hay algo que pide ser entendido con mayor claridad aquí.

Hasta la parte de interpretación del género, está muy bien. Pero no veo cuál es el problema detrás de la comparación de un hombre bajo y una mujer alta. Aquí está mi punto: de hecho, tiene aún más sentido (dado el supuesto de que los hombres son más altos en promedio). No se puede comparar un 'hombre bajo' y una mujer 'baja' exactamente por la misma razón, que la diferencia en los ingresos se explica en alguna parte por la diferencia en las alturas. Lo mismo ocurre con los hombres altos y las mujeres altas, y aún más para las mujeres bajas y los hombres altos (lo cual está más allá de la cuestión, por así decirlo). Así que, básicamente, el efecto de la altura se elimina solo en el caso cuando se comparan hombres bajos y mujeres altas (y esto ayuda a interpretar el coeficiente de género). ¿No suena una campana sobre conceptos subyacentes similares detrás de los modelos de combinación populares?

La idea detrás de la paradoja de Simpson es que el efecto de la población podría ser diferente del o los efectos sabios del subgrupo. Esto está, en cierto sentido, relacionado con su punto 2 y el hecho de que él reconoce que la altura no debe controlarse por sí sola (lo que decimos omitió el sesgo variable). Pero no pude relacionar esto con la controversia sobre el coeficiente de género.

¿Tal vez puedas expresarlo más claramente? O comentar sobre mi comprensión?


La validación cruzada examina subconjuntos aleatorios de la población, tratando de tener un sobreajuste mínimo y la mejor generalización.
EngrStudent - Restablecer Monica

1
Si entiendo sus preocupaciones correctamente, creo que podría beneficiarse de mirar también la paradoja del Señor. @article {lord67, author = {Lord, FM}, title = {Una paradoja en la interpretación de las comparaciones grupales}, journal = {Psychological Bulletin}, year = {1967}, volume = {68}, pages = {304- -305}, palabras clave = {cambiar puntajes}} @artículo {lord69, autor = {Lord, FM}, título = {Ajustes estadísticos al comparar grupos preexistentes}, revista = {Boletín psicológico}, año = {1969}, volumen = {72}, páginas = {336--337}, palabras clave = {cambiar puntajes}}
mdewey

1
Judea Pearl hizo otra publicación sobre la paradoja de Simpson recientemente . Estoy bastante seguro de que no está de acuerdo con la presentación de Gelman. Por una vez, el segundo punto no es la "paradoja". La reversión de las estimaciones como consecuencia de lo que condiciona es un hecho matemático. Lo que lo hace potencialmente paradójico es cuando haces interpretaciones causales de ambas estimaciones. En segundo lugar, ¿por qué esta restricción a las causas manipulables solamente?
NRH

Respuestas:


9

No estoy totalmente seguro de su pregunta, pero puedo comentar sobre sus afirmaciones y su confusión en el modelo de ejemplo.

Andrew no tiene muy claro si el interés científico radica en la asociación de ingresos por sexo ajustada por altura o la asociación de ingresos por altura ajustada por sexo . En un marco modelo causal, el sexo causa altura, pero la altura no causa sexo. Entonces, si queremos el impacto del sexo, ajustar la altura introduciría un sesgo de mediador (¡posiblemente un sesgo de colisión también, ya que las personas ricas son más altas!). Me resulta confuso y divertido cuando veo una investigación aplicada que interpreta el otro"covariables" (factores de confusión y variables de precisión) que se incluyen en un modelo. No tienen sentido, pero simplemente proporcionan una estratificación adecuada para hacer la comparación que sea necesaria. Ajustar la altura, si está interesado en la inferencia de diferencias de ingresos basadas en el sexo, es lo incorrecto .

Estoy de acuerdo en que los hechos contradictorios no son necesarios para explicar la paradoja de Simpson. Pueden ser simplemente un rasgo intrínseco a los datos. Creo que tanto los RR brutos como los ajustados son, en cierto sentido, correctos sin ser causales. Es más problemático, por supuesto, cuando el objetivo es el análisis causal, y el sobreajuste revela problemas de no colapsabilidad (que infla un OR) y un tamaño de muestra insuficiente.

Como recordatorio para los lectores: la paradoja de Simpson es un fenómeno muy específico que se refiere a una instancia en la que una asociación cambia de dirección después de controlar una variable de confusión. Los datos de admisión de Berkeley fueron el ejemplo motivador. Allí, los crudos RR mostraron que las mujeres tenían menos probabilidades de ser aceptadas en Berkeley. Sin embargo, una vez estratificados por los departamentos , los RR mostraron que las mujeres tenían más probabilidades de ser aceptadas en cada departamento . Simplemente tenían más probabilidades de postularse a los departamentos difíciles que rechazaban a muchas personas.

Ahora, en la teoría de la inferencia causal, estaríamos confundidos al concebir que el departamento que se aplica a causa el género. El género es intrínseco, ¿verdad? Pues sí y no. Miettenen defiende un enfoque de "base de estudio" para tales problemas: ¿quién es la población? No todos los estudiantes son elegibles, son los que aplican específicamente a Berkeley. Los departamentos más competitivos han atraído a las mujeres a postularse a Berkeley cuando no hubieran solicitado lo contrario. Para expandirse: una mujer que es profundamente inteligente quiere entrar en el mejor, digamos, programa de ingeniería. Si Berkeley no hubiera tenido un gran programa de ingeniería, de todos modos no se hubiera postulado a Berkeley, se hubiera postulado a MIT o CalPoly. Entonces, en esa luz, el departamento de población "estudiante solicitante" causa género y es un factor de confusión. (Advertencia: soy un estudiante universitario de primera generación, así que no sé mucho sobre qué programas son famosos por qué).

Entonces, ¿cómo resumimos estos datos? Es cierto que Berkeley tenía más probabilidades de admitir a un hombre que presentó la solicitud que a una mujer. Y es cierto que los departamentos de Berkeley tenían más probabilidades de admitir mujeres que de admitir hombres. Los RR crudos y estratificados son medidas sensatas incluso si no son causales. Esto subraya lo importante que es ser preciso con nuestra redacción como estadísticos (el humilde autor no presume ser remotamente preciso).

La confusión es un fenómeno distinto de la no colapsabilidad, otra forma de sesgo variable omitido, pero que se sabe que produce efectos más leves en las estimaciones. A diferencia de la regresión logística, la no colapsabilidad no causa sesgo en la regresión lineal. y la consideración de un continuo en el ejemplo de Gelman debería haberse descrito más a fondo.

La interpretación de Andrew del coeficiente de sexo en su modelo de ingreso ajustado por sexo / altura revela la naturaleza de los supuestos del modelo: el supuesto de linealidad. De hecho, en el modelo lineal, tales comparaciones entre hombres y mujeres están habilitadas porque para una mujer específica, podemos predecirqué altura similar podría haber ganado un hombre, incluso si no fue observado. Este también es el caso si se permite la modificación del efecto, de modo que la pendiente de la tendencia en las mujeres sea diferente de la de los hombres. Por otro lado, no creo que sea una locura concebir hombres y mujeres de la misma altura, 66 pulgadas serían una mujer alta y un hombre bajo. Me parece una proyección leve, en lugar de una gran extrapolación. Además, dado que los supuestos del modelo pueden establecerse claramente, ayuda a los lectores a comprender que la asociación de altura de ingresos estratificada por sexo contiene información que se toma prestada en o se promedia entre muestras de hombres y mujeres. Si tal asociación fuera objeto de inferencia, el estadístico serio obviamente consideraría la posibilidad de modificar el efecto.


2
Gran discusión Como estadístico, me irrita cuando las personas hablan sobre los resultados de un estudio, pero no están seguras de si están hablando de efectos marginales o condicionales.
Cliff AB

1

"¿Por qué comparar a un hombre y una mujer que miden 66 pulgadas de alto, por ejemplo? Esa sería una comparación de un hombre bajo con una mujer alta "

El modelo supone que el ingreso depende del género y la altura. Sin embargo, la forma en que la altura genera mayores ingresos puede no ser la misma para hombres y mujeres. Las mujeres pueden considerarse altas "lo suficiente" a una altura para la cual un hombre aún puede considerarse bajo.

Simplificar el modelo de la siguiente manera puede ser útil.

Suponga que desea hacer retroceder la probabilidad de ser empleado como asistente de tienda en grandes tiendas de ropa y considere la siguiente estrategia de identificación.

Usted observa que es más probable que los empleadores contraten trabajadores que cumplan una cierta altura mínima, donde el "mínimo" es relativo al género.

En lugar de medir la altura en cm, supongamos que existen dos valores de umbral que definen a qué altura, respectivamente, un hombre y una mujer son "altos":> = 180 cm para los hombres y> = 170 cm para las mujeres.

Suponiendo que los umbrales existen en la realidad (es decir, los empleadores hacen una diferencia marcada real entre ser mujeres y 169 cm o 171 cm de altura), y que son los correctos, puede construir un maniquí que define hombres y mujeres altos / bajos. Los hombres y las mujeres de diferentes alturas aún pueden caer en la misma categoría de su maniquí y, al mismo tiempo, su medida es consistente con la dinámica real de ese mercado laboral en particular.


-1

¿Le diría (en palabras más simples) que la típica lucha de género que dice que los hombres tienen más oportunidades que las mujeres ya que sus ingresos son p% más altos estaría sesgada paradójicamente?

Quizás ese sea un punto. Tendemos a ver las cosas como se ven y no analizar las implicaciones subyacentes.

Para ir más allá de la paradoja de Simpson, tendríamos que responder a la pregunta "¿Cuánto más dinero gana una mujer haciendo la misma cantidad de trabajo imparcial en comparación con un hombre?" entonces alguien podría decir que tienen que estar embarazadas y criar a sus hijos más que sus contrapartes, lo cual es cierto, pero lo importante es que se suspira solo por decir: "las mujeres por el solo hecho de ser mujeres tienen menos oportunidades" y un profundo El análisis con estadísticas condicionales nos llevaría a ver que, en esencia, tiende a haber igualdad de oportunidades y que son otros factores no relacionados con el sexo lo que hace que las estadísticas parezcan discriminaciones relacionadas con cuestiones de sexo.


Puede ser útil comprender que dicho análisis puede no ser necesariamente causal ni explicativo, sino descriptivo del fenómeno existente.
AdamO
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.