Comparación de dos muestras de proporciones, estimación del tamaño de la muestra: R vs Stata

Comparación de dos muestras de proporciones, estimación del tamaño de la muestra: R vs Stata

Obtuve resultados diferentes para los tamaños de muestra, de la siguiente manera:

En R

power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05)

Resultado: (entonces 161) para cada grupo. $n = 160.7777$

En Stata

sampsi 0.70 0.85, power(0.90) alpha(0.05)

Resultado: para cada grupo. $n = 174$

¿Por qué la diferencia? Gracias.

Por cierto, ejecuté el mismo cálculo de tamaño de muestra en SAS JMP , el resultado: (casi lo mismo que el resultado R). $n = 160$

— dwstu
fuente

La diferencia se debe al hecho de que el sampsicomando de Stata (en desuso a partir de Stata 13 y reemplazado por power) usa la corrección de continuidad de forma predeterminada, mientras que R power.prop.test()no lo hace (para obtener detalles sobre la fórmula utilizada por Stata, consulte las dos proporciones de potencia [PSS] ). Esto se puede cambiar con la nocontinuityopción, por ejemplo,

sampsi 0.70 0.85, power(0.90) alpha(0.05) nocontinuity

que produce un tamaño de muestra de 161 por grupo. El uso de la corrección de continuidad produce una prueba más conservadora (es decir, un tamaño de muestra más grande), y obviamente importa menos a medida que aumenta el tamaño de la muestra.

Frank Harrell, en la documentación de bpower(parte de su paquete Hmisc ), señala que la fórmula sin la corrección de continuidad es bastante precisa, lo que proporciona alguna justificación para renunciar a la corrección.

— Phil Schumm
fuente

Gran respuesta. Parece que no la diferencia entre los dos métodos en mi publicación es la causa de la diferencia, pero el hecho de que uno de estos métodos está usando la corrección de continuidad y el otro no.

— Michael M

Gracias. Con solo dos proporciones (es decir, una tabla de 2x2), no importa si especifica la alternativa como dos proporciones o una proporción y una razón de probabilidades. Y dado que la prueba exacta de Fisher es conservadora para el problema binomial de dos muestras, las estimaciones de potencia basadas en esto son más cercanas a las de la fórmula con corrección de continuidad.

— Phil Schumm

bsamsize(0.70, 0.85, alpha=0.05, power=0.90)

n_{1} = n_{2} = 160.7777

$n_1=n_2=160.7777$