Admito que el párrafo puede ser confuso.
Al realizar una prueba de permutación, usted estima un valor p. El problema es que la estimación del valor p tiene un error en sí mismo que se calcula como . Si el error es demasiado grande, el valor p no es confiable.p ( 1 - p )k-----√
Entonces, ¿cuántas permutaciones k necesita uno para obtener una estimación confiable?
Primero defina su error máximo permitido, también conocido como precisión. Que esta sea . Entonces, un valor p estimado debe estar en el intervalo (ya que p es aproximadamente normal distribuido )PAGS[ p - 3 ∗ P, p + 3 ∗ P]
Usando el límite superior
El párrafo citado del artículo sugiere utilizar como una estimación del límite superior del error en lugar de . Esto corresponde a un valor p desconocido de p = 0.5 (donde el error es máximo entre todos los ps para una k fija).12k√p ( 1 - p )k-----√
Por lo tanto: ¿Quieres saber donde k .12k√≤ P
<=>14 4PAGS2≤ k
Pero dado que la fórmula citada representa un límite superior, este enfoque es muy aproximado.
Usando el error en el nivel de significancia
Otro enfoque utiliza el nivel de significancia deseado como p para calcular la precisión requerida. Esto es correcto, porque el error de la p estimada es más importante si estamos cerca del umbral de decisión (que es el nivel de significancia).α
En este caso se quiere saber donde k .α(1−α)k−−−−−√≤P
<=>(α(1−α))P2≤k
Tenga en cuenta que si el verdadero valor p desconocido es claramente mayor que , entonces el error es realmente mayor, por lo que p en ya no se mantiene.α[p−3∗P,p+3∗P]
Extendiendo el intervalo de confianza
Este enfoque corresponde con el centro del intervalo de confianza justo en el umbral de decisión. Para forzar el límite superior del intervalo de confianza de la p estimada por debajo del umbral de decisión (que es más correcto), uno necesita ...
lα(1−α)k−−−−−√≤P
<=>(l)2(α(1−α))P2≤k
donde l corresponde a (ver de nuevo el gráfico )
| l | confidence interval |
| 1 | ~68 % |
| 2 | ~95 % |
| 3 | ~99 % |
Ejemplos:
Sea la precisión deseada P 0.005.
Luego, utilizando el límite superior aproximado, se obtiene .k>=10000
Usando P en y solicitando un intervalo de confianza del 95%, se obtiene .α=0.05k>=7600
Para P = 0.01 en y un intervalo de confianza del 95% se obtiene k> = 396.α=0.01
Finalmente : sugiero sumergirse más profundamente en las simulaciones de Montecarlo. La wikipedia proporciona un comienzo.