Tengo dos muestras muy sesgadas y estoy tratando de usar bootstrapping para comparar sus medias usando la estadística t.
¿Cuál es el procedimiento correcto para hacerlo?
El proceso que estoy usando
Me preocupa la conveniencia de utilizar el error estándar de los datos originales / observados en el paso final cuando sé que esto no se distribuye normalmente.
Aquí están mis pasos:
- Bootstrap: muestra aleatoria con reemplazo (N = 1000)
- Calcule la estadística t para cada arranque para crear una distribución t :
- Estime los intervalos de confianza t obteniendo los percentiles y 1 - α / 2 de la distribución t
Obtenga intervalos de confianza a través de:
- Mire dónde caen los intervalos de confianza para determinar si hay una diferencia significativa en las medias (es decir, no es cero)
También he analizado la suma de rango de Wilcoxon, pero no está dando resultados muy razonables debido a la distribución muy sesgada (por ejemplo, el percentil 75 == 95). Por esta razón, me gustaría explorar más la prueba t de arranque.
Entonces mis preguntas son:
- ¿Es esta una metodología apropiada?
- ¿Es apropiado usar el SE de los datos observados cuando sé que está muy sesgado?
Posible duplicado: ¿Qué método se prefiere, una prueba de arranque o una prueba no paramétrica basada en el rango?