Prueba de permutación que compara una sola muestra con una media

Cuando las personas implementan pruebas de permutación para comparar una sola muestra con una media (por ejemplo, como podría hacer con una prueba t de permutación), ¿cómo se maneja la media? He visto implementaciones que toman una media y una muestra para una prueba de permutación, pero no está claro qué están haciendo realmente bajo el capó. ¿Existe incluso una manera significativa de hacer una prueba de permutación (por ejemplo, prueba t) para una muestra versus una media supuesta? O, alternativamente, ¿están simplemente en una prueba de no permutación bajo el capó? (p. ej., a pesar de llamar a una función de permutación o establecer un indicador de prueba de permutación, el valor predeterminado es una prueba t estándar o una función similar)

En una prueba de permutación estándar de dos muestras, uno tendría dos grupos y aleatorizaría la asignación de etiquetas. Sin embargo, ¿cómo se maneja esto cuando un "grupo" es una media asumida? Obviamente, una media supuesta no tiene un tamaño de muestra en sí mismo. Entonces, ¿cuál es la forma típica de trabajar la media en un formato de permutación? ¿Se supone que la muestra "media" es un punto único? ¿Una muestra de igual tamaño al grupo de muestra? ¿Una muestra de tamaño infinito?

Dado que una media asumida es, bueno, asumida, yo diría que técnicamente tiene soporte infinito o cualquier soporte que desee asumir. Sin embargo, ninguno de estos es muy útil para un cálculo real. Una muestra de igual tamaño con valores todos iguales a la media parece ser lo que se hace a veces con algunas pruebas (por ejemplo, simplemente completa la otra mitad de los pares con la ubicación supuesta). Esto tiene un poco de sentido, ya que es la muestra de igual longitud que vería si su media supuesta fuera correcta sin variación.

Entonces mi pregunta es esta: en la práctica, ¿emulan realmente las personas la aleatorización de etiquetas de estilo de prueba de permutación cuando el segundo conjunto es una media (o un valor supuesto abstracto similar)? Si es así, ¿cómo manejan las personas la aleatorización de etiquetas cuando hacen esto?

t-test permutation-test

— Namey
fuente

Una prueba de permutación de una media hipotética específica no es diferente de restar esa media hipotética de los datos y probar contra una media de cero. Una prueba emparejada se discute aquí ; supone que bajo el valor nulo los pares tienen la misma distribución, lo que implica que las diferencias en las que se basa la prueba posterior de una muestra se suponen simétricas. Sobre esa base, los signos se voltean al azar en cada diferencia ... (ctd)

— Glen_b -Reinstate a Monica el

2^{n}

$2^n$

Eso tiene sentido. Pero estoy pensando un poco en las implementaciones computacionales que hacen las personas. Si puede transformarlo en una prueba de signos, ¿la gente realmente se molesta en calcular las permutaciones? Para cualquier secuencia de longitud N, el conjunto completo de permutaciones de volteretas de signos sería el mismo, ¿no? Así que pensaría que, bajo el capó, la gente podría simplemente canalizarlo en una prueba binomial en lugar de generar manualmente las permutaciones que hacen una distribución binomial. Principalmente me pregunto si / cuándo hay beneficios al volver a etiquetar y permutar en comparación con el uso de una prueba estándar en el caso de muestra única frente a media.

— Nombre

k^{th}

$k^\text{th}$

x_{i}

$x_i$

s_{i}^{[k]} | x_{i} |

$s_i^{[k]} |x_i|$

s

$s$

+ 1

$+1$

- 1

$-1$

x_{10}

$x_{10}$

x_{10}

$x_{10}$ Todos serían -11.43 o +11.43. Si clasificó primero los datos absolutos, en realidad terminaría con una prueba de rango con signo de Wilcoxon, por lo que es como la versión sin clasificar (datos originales) de eso.

— Glen_b -Reinstate Monica

Expandiendo el comentario de Glen_b en una respuesta

Una prueba de permutación aproximada de una muestra para la media de una muestra, contra una hipótesis nula de media cero, se implementa mediante la asignación de signos aleatorios a los datos de la muestra. Las hipótesis nulas distintas de cero se pueden probar restando la media nula deseada de los datos.

Esto es fácil de ver en la fuente de la función R onetPermutationen el paquete DAAG. Aquí hay un extracto del código relevante, con comentarios que agregué:

function (x, nsim) {

  ## Initialize and pre-allocate

  n <- length(x)
  dbar <- mean(x)
  absx <- abs(x)  # there's actually a bug in the code; below you'll see that the function ends up re-computing abs(x) instead of using this
  z <- array(, nsim)


  ## Run the simulation    

  for (i in 1:nsim) {                             # Do nsim times:
      mn <- sample(c(-1, 1), n, replace = TRUE)   #  1. take n random draws from {-1, 1}, where n is the length of the data to be tested
      xbardash <- mean(mn * abs(x))               #  2. assign the signs to the data and put them in a temporary variable
      z[i] <- xbardash                            #  3. save the new data in an array
  }


  ## Return the p value
  # p = the fraction of fake data that is:
  #      larger than |sample mean of x|, or
  #    smaller than -|sample mean of x|

  (sum(z >= abs(dbar)) + sum(z <= -abs(dbar)))/nsim
}

— Shadowtalker
fuente