Actualización 2014-01-15
Me doy cuenta de que no respondí la pregunta original de Danica sobre si el margen de error para la proporción deshabilitada indirectamente ajustada sería mayor o menor que el margen de error para la misma tasa en ACS. La respuesta es: si las proporciones de la categoría de la compañía no difieren drásticamente de las proporciones estatales de ACS, el margen de error que figura a continuación será menor que el margen de error de ACS. La razón: la tasa indirecta trata los recuentos de personas de categoría laboral de la organización (o proporciones relativas) como números fijos . La estimación de ACS de la proporción de discapacitados requiere, en efecto, una estimación de esas proporciones, y los márgenes de error aumentarán para reflejar esto.
Para ilustrar, escriba la tasa deshabilitada como:
PAG^a dj= ∑ nyonortepagyo^
donde es la tasa de discapacidad estimada en la categoría en el ACS.pag^yoi
Por otro lado, la tasa estimada de ACS es, en efecto:
P^acs=∑(NiN)ˆpi^
donde y son respectivamente la categoría de población y los totales generales y es la proporción de población en la categoría .NiNNi/Ni
Por lo tanto, el error estándar para la tasa ACS será mayor debido a la necesidad de estimar además de .Ni/Npi
Si las proporciones de la categoría de la organización y las proporciones estimadas de la población difieren mucho, entonces es posible que . En un ejemplo de dos categorías que construí, las categorías se representaron en proporciones y . El error estándar para la proporción estimada deshabilitada fue .SE(P^adj)>SE(P^acs)N1/N=0.7345N2/N=0.2655SE(P^acs)=0.0677
Si yo consideraba 0.7345 y 0.2655 a ser los valores fijos y (el enfoque de ajuste indirecto), , mucho más pequeño. Si, en cambio, y , , casi lo mismo que En el extremo y , . Me sorprendería si las proporciones de organización y categoría de población difieren tan drásticamente. Si no lo hacen, creo que es seguro usar el margen de error de ACS como una estimación conservadora, posiblemente muy conservadora, del verdadero margen de error.n1/nn2/nSE(P^adj)=0.0375n1/n=0.15n2/n=0.85SE(P^adj)=0.0678SE(P^acs)n1/n=0.001S E ( P un d j ) = 0,079n2/n=0.999SE(P^adj)=0.079
Actualización 2014-01-14
Respuesta corta
En mi opinión, sería irresponsable presentar una estadística de este tipo sin un IC o margen de error (longitud del IC medio). Para calcularlos, deberá descargar y analizar la Muestra de microdatos de uso público (PUMS) de ACS ( http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/ ).
Respuesta larga
Esto no es realmente una nueva ponderación de la ACS. Es una versión de estandarización indirecta, un procedimiento estándar en epidemiología (google o vea cualquier texto epi). En este caso, las tasas de discapacidad del trabajo (categoría) de ACS estatales se ponderan por los recuentos de empleados de la categoría de trabajo de la organización. Esto calculará un número esperado de personas discapacitadas en la organización E
, que se puede comparar con el número observado O
. La métrica habitual para la comparación es una relación estandarizada R= (O/E)
. (El término habitual es "SMR", para "índice de mortalidad estandarizado", pero aquí el "resultado" es la discapacidad). R
es también la relación entre la tasa de discapacidad observada (O/n)
y la tasa indirectamente estandarizada (E/n)
, donde n
es el número de empleados de la organización.
En este caso, parece que solo se necesitará un CI para E
o E/n
, por lo que comenzaré con eso:
Si
n_i = the organization employee count in job category i
p_i = disability rate for job category i in the ACS
Entonces
E = sum (n_i p_i)
La varianza de E
es:
var(E) = nn' V nn
donde nn
es el vector de columna de la categoría de organización cuenta y V
es la matriz de varianza-covarianza estimada de las tasas de discapacidad de la categoría ACS.
Además, trivialmente, se(E) = sqrt(var(E))
y se(E/n) = se(E)/n
.
y un IC del 90% para E es
E ± 1.645 SE(E)
Divide entre n
para obtener el CI para E/n
.
Para estimar var(E)
, deberá descargar y analizar los datos de la muestra de microdatos de uso público (PUMS) de ACS ( http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/ ).
Solo puedo hablar del proceso de computación var(E)
en Stata. Como no sé si está disponible para usted, diferiré los detalles. Sin embargo, alguien conocedor de las capacidades de encuesta de R o (posiblemente) SAS también puede proporcionar el código de las ecuaciones anteriores.
Intervalo de confianza para la relación R
Los intervalos de confianza para R
se basan normalmente en una suposición de Poisson para O
, pero esta suposición puede ser incorrecta.
Podemos considerar O
y E
ser independientes, entonces
log R = log(O) - log(E) ->
var(log R) = var(log O) + var(log(E))
var(log(E))
se puede calcular como un paso más de Stata después del cálculo de var(E)
.
Bajo el supuesto de independencia de Poisson:
var(log O) ~ 1/E(O).
Un programa como Stata podría ajustarse, por ejemplo, a un modelo binomial negativo o modelo lineal generalizado y darle un término de varianza más preciso.
Un IC aproximado del 90% para log R
es
log R ± 1.645 sqrt(var(log R))
y los puntos finales se pueden exponer para obtener el IC R
.