Prueba de Wald en regresión (OLS y GLM): distribución t- vs. z

22

Yo entiendo que la prueba de Wald para los coeficientes de regresión se basa en la propiedad después de que mantiene asintóticamente (por ejemplo Wasserman (2006): Todos Estadística , páginas 153, 214-215): Dondedenota el coeficiente de regresión estimado,denota el error estándar del coeficiente de regresión yes el valor de interés (es generalmente de 0 para probar si el coeficiente es significativamente diferente de 0). Por lo tanto, laprueba detamañoWald es: rechazarcuando

\frac{(\hat{β} - β_{0})}{\hat{se} (\hat{β})} \sim N (0, 1)

$\frac{(\hat{\beta}-\beta_{0})}{\widehat{\operatorname{se}}(\hat{\beta})}\sim \mathcal{N}(0,1)$

\hat{β}

$\hat{\beta}$

\hat{se} (\hat{β})

$\widehat{\operatorname{se}}(\hat{\beta})$

β_{0}

$\beta_{0}$

β_{0}

$\beta_{0}$

α

$\alpha$

H_{0}

$H_{0}$

donde

| W | > z_{α / 2}

$|W|> z_{\alpha/2}$

W = \frac{\hat{β}}{\hat{se} (\hat{β})} .

$W=\frac{\hat{\beta}}{\widehat{\operatorname{se}}(\hat{\beta})}.$

Pero cuando realiza una regresión lineal con lmen R, se usa un valor lugar de un valor para probar si los coeficientes de regresión difieren significativamente de 0 (con ). Además, la salida de en R a veces da valores otras veces como estadísticas de prueba. Aparentemente, los valores se usan cuando se supone que el parámetro de dispersión se conoce y los valores se usan cuando se estima el parámetro de dispersión (vea este enlace ). $t$ $z$ summary.lmglm $z$ $t$ $z$ $t$

¿Podría alguien explicar por qué a veces se usa una distribución para una prueba de Wald a pesar de que se supone que la relación del coeficiente y su error estándar se distribuye como normal normal? $t$

Editar después de responder la pregunta

Esta publicación también proporciona información útil para la pregunta.

r regression hypothesis-testing generalized-linear-model

— COOLSerdash
fuente

2

¿Qué te hace pensar que la estadística de prueba que se informa es necesariamente una prueba de Wald?

— Glen_b -Reinstate Monica el

3

Debido a que los valores

- o

son siempre el coeficiente dividido por su error estándar en y .

z

$z$

t

$t$ lmglm

— COOLSerdash

20

La salida del glmuso de una distribución de Poisson da un valor porque con una distribución de Poisson, la media y el parámetro de varianza son los mismos. En el modelo de Poisson, solo tiene que estimar un único parámetro ( ). En un lugar donde debe estimar tanto un parámetro de media como de dispersión, debería ver la distribución utilizada. $z$ $\lambda$ glm $t$

Para una regresión lineal estándar, se supone que el término de error se distribuye normalmente. Aquí, el parámetro de varianza tiene que ser estimado, de ahí el uso de la distribución para el estadístico de prueba. Si de alguna manera conociera la varianza de la población para el término de error, podría usar una estadística test $t$ $z$

$t$

— wcampbell
fuente

3

En el marco GLM, en general, la estadística de prueba W que mencionó está distribuida asintóticamente Normal , es por eso que ve en R los valores z .

Además de eso, cuando se trata de un modelo lineal, es decir, un GLM con una variable de respuesta distribuida normal, la distribución del estadístico de prueba es una t de Student , por lo que en R tiene valores t .

— EdoLu
fuente