Voy a hacer ingeniería inversa de esto por experiencia con casos de discriminación. Definitivamente puedo establecer de dónde provienen los valores de "uno en 741" , etc. Sin embargo, se perdió tanta información en la traducción que el resto de mi reconstrucción se basa en haber visto cómo las personas hacen estadísticas en la sala del tribunal. Solo puedo adivinar algunos de los detalles.
Desde el momento en que se aprobaron las leyes contra la discriminación en la década de 1960 (Título VI), los tribunales de los Estados Unidos han aprendido a analizar los valores p y compararlos con umbrales de y 0.01 . También han aprendido a observar los efectos estandarizados, típicamente denominados "desviaciones estándar", y compararlos con un umbral de "dos a tres desviaciones estándar". Con el fin de establecer un caso prima facie para una demanda por discriminación, los demandantes generalmente intentan un cálculo estadístico que muestre un "impacto dispar" que exceda estos umbrales. Si tal cálculo no puede ser soportado, el caso generalmente no puede avanzar.0,050,01
Los expertos en estadísticas de los demandantes a menudo intentan expresar sus resultados en estos términos familiares. Algunos de los expertos llevan a cabo una prueba estadística en la cual la hipótesis nula expresa "ningún impacto adverso", suponiendo que las decisiones de empleo fueron puramente aleatorias y no fueron controladas por ninguna otra característica de los empleados. (Si se trata de una alternativa de una o dos colas puede depender del experto y las circunstancias). Luego convierten el valor p de esta prueba en una serie de "desviaciones estándar" al referirse a la distribución Normal estándar. - incluso cuando la Normal estándar es irrelevante para la prueba original. De esta manera indirecta, esperan comunicar sus conclusiones claramente al juez.
La prueba preferida para los datos que se pueden resumir en tablas de contingencia es la prueba exacta de Fisher. La aparición de "Exacto" en su nombre es particularmente agradable para los demandantes, porque connota una determinación estadística que se ha hecho sin error (¡lo que sea que sea!).
Aquí, entonces, está mi (reconstrucción especulativa) de los cálculos del Departamento de Trabajo.
χ2
Convirtieron su valor p en una puntuación Z normal ("número de desviaciones estándar").
Se redondean la puntuación Z al entero más próximo: "excede tres desviaciones estándar", "excede cinco desviaciones estándar" y "excede de seis desviaciones estándar". (Debido a que algunas de estas puntuaciones Z redondea el arriba a las desviaciones estándar más, no puedo justificar la "excede"; todo lo que puedo hacer es citar a ella).
En la queja, estas puntuaciones Z integrales se convirtieron nuevamente a valores p. Nuevamente se usó la distribución normal estándar.
Estos valores p se describen (posiblemente de manera engañosa) como "la probabilidad de que este resultado ocurra de acuerdo con el azar".
1 / 12801 / 5650001 / 5800000073011601307301160130- 3.16- 4.64- 5.521 / 7411 / 35000001 / 1000000000
Aquí hay un R
código utilizado para realizar estos cálculos.
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))