Comprender la salida de un bootstrap realizado en R (tsboot, MannKendall)


11

Tengo una pregunta sobre la interpretación de la llamada tsboot en R. Revisé la documentación de Kendall y el paquete de arranque, pero no soy más inteligente que antes.

Cuando ejecuto un bootstrap usando, por ejemplo, el ejemplo en el paquete Kendall, donde la estadística de prueba es la tau de Kendall:

library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)

lo que confirma la tendencia al alza:

tau = 0.265, 2-sided pvalue =0.00029206

El ejemplo continúa usando un bloque de arranque:

#
#Use block bootstrap 
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")

Recibo el siguiente resultado:

BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5 
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5, 
sim = "fixed")


Bootstrap Statistics :
 original     bias    std. error
t1* 0.2645801 -0.2670514  0.09270585

Si entiendo correctamente, el "t1 * original" es el MKtau original, el "sesgo" es la media del MKtau de la serie de tiempo de arranque R = 500, y el "error estándar" es la desviación estándar del MKtaus de Las 500 muestras.

Tengo problemas para entender lo que esto significa: esto básicamente me dice que los 500 MKTaus son más bajos que el original, y que el t1 * original está en el rango de 3 sd del MKtaus bootstrapped. Ergo es significativamente diferente?

¿O diría que el MKtau para el conjunto de datos es 0.26 error estándar más / menos?

Lamento la larga pregunta, pero soy un novato en estadística y estoy aprendiendo a través del autoaprendizaje, sin alguien que pueda resolver este problema probablemente realmente simple de un lado a otro.


66
En la salida biases simplemente la diferencia entre la media de las 500 muestras de bootstrap almacenadas y la estimación original. El std. errores la desviación estándar de las 500 muestras de bootstrap y es una estimación del error estándar. El resultado le indica que su estimación original es más alta que la media de las 500 estimaciones de arranque (por lo que no todos los MKtaus de arranque son más bajos). El bootstrap a menudo se usa para calcular errores estándar / intervalos de confianza sin hacer suposiciones sobre la distribución. Use la boot.cifunción para calcular los intervalos de confianza.
COOLSerdash

@COOLSerdash, ¡gracias por esto! Entonces, si mi estadística original es 3d superior a la media de la estadística bootstrap, ¿puedo concluir algo directamente (por ejemplo: la estadística es significativa en 0.99)? También usé el boot.cipara calcular los intervalos de confianza, y nuevamente, la estadística originalmente calculada se encuentra fuera de estos intervalos.
Maria

No, no se compara la estadística bootstrapped con la estadística original con una prueba de hipótesis. Simplemente usaría / informaría el error estándar de arranque y los intervalos de confianza en su caso.
COOLSerdash

Respuestas:


3

Después de haber encontrado la misma pregunta y haberla explorado con un conjunto de datos controlado: modelo y = ax + b con N (0, sig) errores, encuentro que el paquete Kendall puede no funcionar como se anuncia. La x en mi caso era 1:100, y y = x , con sig = 100 (varianza del término de error).

La regresión se ve bien, y también la tau de Kendall. Aquí no hay autocorrelación que no sea la inducida por el modelo lineal. Ejecutar la prueba de Kendall como se anuncia con longitudes de bloque de 1, 3, 5 y 10 produce valores de sesgo muy grandes y boot.cino informa ninguna tendencia.

Posteriormente, codifiqué manualmente el arranque de los datos con estas longitudes de bloque, y con mi serie de control, obtengo resultados razonables en cuanto a la media de las muestras de arranque y su propagación. Por lo tanto, es posible que algo haya salido mal con el paquete Kendall con respecto al bloque de arranque.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.