Digamos que tengo dos condiciones, y el tamaño de mi muestra para las dos condiciones es extremadamente bajo. Digamos que solo tengo 14 observaciones en la primera condición y 11 en la otra. Quiero usar la prueba t para probar si las diferencias de medias son significativamente diferentes entre sí.
En primer lugar, estoy un poco confundido acerca de la suposición de normalidad de la prueba t, que podría ser la razón por la que no estoy totalmente haciendo bootstrapping. ¿Es la suposición para la prueba t que (A) los datos se muestrean de una población normal, o (B) que sus distribuciones de muestra tienen propiedades gaussianas? Si es (B), entonces no es realmente una suposición, ¿verdad? Simplemente puede trazar un histograma de sus datos y ver si es normal o no. Sin embargo, si el tamaño de mi muestra es bajo, no tendré suficientes puntos de datos para ver si mi distribución de muestra es normal.
Aquí es donde creo que entra el bootstrapping. Puedo hacer bootstrap para ver si mi muestra es normal, ¿verdad? Al principio pensé que el bootstrapping siempre resultaría en una distribución normal, pero este no es el caso ( ¿Se puede usar el remuestreo Bootstrap para calcular un intervalo de confianza para la varianza de un conjunto de datos? Statexchange statexchange ). Por lo tanto, una de las razones por las que usaría bootstrap es para estar más seguro de la normalidad de sus datos de muestra, ¿correcto?
Sin embargo, en este punto me confundo completamente. Si realizo una prueba t en R con la función t.test y pongo los vectores de muestra bootstrap como las dos muestras independientes, mi valor t simplemente se vuelve increíblemente significativo. ¿No estoy haciendo la prueba t de arranque correctamente? No debo hacerlo, ya que todo lo que está haciendo bootstrapping es solo aumentar mi valor t, ¿no ocurriría esto en todos los casos? ¿Las personas no realizan una prueba t en las muestras cargadas?
Por último, ¿cuál es el beneficio de calcular los intervalos de confianza en un bootstrap versus calcular los intervalos de confianza en nuestra muestra original? ¿Qué me dicen estos intervalos de confianza que los intervalos de confianza en los datos de muestra originales no?
Supongo que estoy confundido sobre (A) por qué usar un bootstrap si solo hará que mi valor t sea más significativo, (B) no estoy seguro de la forma correcta de utilizar bootstrapping cuando se ejecuta una prueba t de muestra independiente, y (C) no estoy seguro cómo informar la justificación, ejecución y resultados de bootstrapping en situaciones de prueba t independientes.