Coeficientes de interpretación para la regresión de Poisson

No entiendo cómo interpretar el coeficiente de una regresión de Poisson en relación con el coeficiente de una regresión OLS.

Supongamos que tengo datos de series de tiempo, mi variable del lado izquierdo es la cantidad de juegos ganados por año, y mi variable principal del lado derecho es el valor NASDAQ. Si mi especificación preferida es interpretar el modelo como en términos porcentuales, tomo la transformación de registro de los juegos ganados. También puedo tomar el registro del NASDAQ para decir cuánto aumentaría un 1 por ciento en el NASDAQ el porcentaje de juegos ganados. Ahora, reconozco que un modelo de Poisson podría tener sentido porque los datos de los juegos ganados son recuentos y no continuos. Ejecuto la regresión con muchas, muchas variables de control.

¿No haría una transformación de registro en los juegos ganados y en su lugar usaría solo juegos? Cuando obtengo los coeficientes, ¿hago algún tipo de cálculo de efectos marginales (como se puede hacer para probit)?
¿Cómo interpreto estos coeficientes?
¿Cómo comparo la interpretación del Poisson con la OLS, ya sea la OLS que se transforma con log o la OLS que no?

Sé que este tipo de preguntas ya se han hecho antes, pero aún no las entiendo.

poisson-distribution

— usuario1690130
fuente

Mi respuesta aquí es relevante: stats.stackexchange.com/questions/142338/…

— kjetil b halvorsen

No es crítico, pero este es un ejemplo extraño. No está claro que realmente esté haciendo análisis de series de tiempo, ni lo que el NASDAQ tendría que ver con la cantidad de juegos ganados por algún equipo. Si está interesado en decir algo sobre la cantidad de juegos que ganó un equipo, creo que sería mejor usar la regresión logística binaria, dado que presumiblemente sabe cuántos juegos se juegan. La regresión de Poisson es más apropiada para hablar de conteos cuando el total posible no está bien restringido , o al menos no se conoce.

La forma en que interpretaría sus betas depende, en parte, del enlace utilizado: es posible usar el enlace de identidad, aunque el enlace de registro sea más común (y generalmente más apropiado). Si está utilizando el enlace de registro, probablemente no tomaría el registro de su variable de respuesta; en esencia, el enlace lo está haciendo por usted. Tomemos un caso abstracto, tiene un modelo de Poisson usando el enlace de registro de la siguiente manera:

\hat{y} = exp ({\hat{β}}_{0}) * exp ({\hat{β}}_{1})^{x}

$\hat{y}=\text{exp}(\hat{\beta}_0)*\text{exp}(\hat{\beta}_1)^x$ alternativamente,

\hat{y} = exp ({\hat{β}}_{0} + {\hat{β}}_{1} x)

$\hat{y}=\text{exp}(\hat{\beta}_0+\hat{\beta}_1x)$

(EDITAR: estoy eliminando los "sombreros" de las versiones beta en lo que sigue, porque son feos, pero aún deben entenderse).

Con la regresión OLS normal, está prediciendo la media de una distribución gaussiana de la variable de respuesta condicional a los valores de las covariables. En este caso, está prediciendo la media de una distribución de Poisson de la variable de respuesta condicional a los valores de las covariables. Para OLS, si un caso dado fuera 1 unidad más alto en su covariable, usted espera que, si todo es igual, la media de esa distribución condicional sea ${\beta}_1$ Unidades superiores. Aquí, si un caso dado fuera 1 unidad más alto, ceteris paribus , se espera que la media condicional sea $e^{{\beta}_1}$ veces más alto Por ejemplo, di ${\beta}_1=2$ , entonces en regresión normal es 2 unidades más alto (es decir, +2), y aquí es 7.4 veces más alto (es decir, x 7.4) En ambos casos, ${\beta}_0$ es tu intercepción ; en nuestra ecuación anterior, considere la situación cuando $x=0$ , entonces exp $({\beta}_1)^x=1$ , y el lado derecho se reduce a exp ( ${\beta}_0$ ), que te da la media de $y$ cuando todas las covariables son iguales a 0.

Hay un par de cosas que pueden ser confusas al respecto. Primero, predecir la media de una distribución de Poisson no es lo mismo que predecir la media de un gaussiano. Con una distribución normal, la media es el valor más probable. Pero con el Poisson, la media es a menudo un valor imposible (por ejemplo, si su media pronosticada es 2.7, ese no es un conteo que podría existir). Además, normalmente la media no está relacionada con el nivel de dispersión (es decir, la DE), pero con la distribución de Poisson, la varianza necesariamente es igual a la media (aunque, en la práctica, a menudo no lo hace, lo que lleva a complejidades adicionales). Finalmente, esas exponenciaciones lo hacen más complicado; si, en lugar de un cambio relativo, quisiera saber el valor exacto, tendría que comenzar en 0 (es decir, $e^{{\beta}_0}$ ) y multiplica tu camino $x$ veces. Para predecir un valor específico, es más fácil resolver la expresión dentro de los paréntesis en la ecuación inferior y luego exponerla; esto hace que el significado de la beta sea menos claro, pero las matemáticas son más fáciles y reduce la posibilidad de error.

— gung - Restablece a Monica
fuente

¡Gracias por tu ayuda! Sí, estoy de acuerdo, el ejemplo es terrible. Gracias por la abstracción Entiendo cómo interpretar OLS. Un aumento de 1 unidad en x conduce a un aumento beta_1 en y. Si hago una transformación logarítmica a y, entonces un aumento de 1 unidad en x conduce a un aumento de 100 * beta_1% en y. No entiendo qué hacer con Poisson. Si conozco beta_1, un aumento de 1 unidad en x conduce a un aumento de y en?

— user1690130

Está en la respuesta, en el tercer párrafo. Un aumento de 1 unidad en x conduce a una exp (

β_{1}

$\beta_1$ ) los tiempos aumentan en y. Digamos que tu 'viejo' tenía 10 años, y

β_{1} = 2

$\beta_1=2$ , luego exp (

β_{1}

$\beta_1$ ) = 7.4, yy sería 10 veces 7.4, es decir 74. Si hubiera otra observación que fuera 1 unidad más alta, eso sería 74 * 7.4, etc.

— gung - Vuelva a instalar a Monica

No entiendo porque parece que depende de los valores de x e y? ¿Hay "efectos marginales" por los que las personas tienden a pasar? Por ejemplo, ¿las personas no usan mfx en Stata para informar estimaciones probit?

— user1690130

No entiendo eso. No comparas OLS con Poisson; Son diferentes tipos de modelos para diferentes tipos de situaciones / fenómenos. Son no 2 modelos cultades de la misma cosa en la que 1 modelo podría ser una cuenta mejor que el otro. No compararías un gatito y un árbol de Navidad para ver si yo fuera mejor. No entiendo cómo estás usando la frase "efecto marginal", si te refieres al efecto de un predictor que ignora los efectos de todas las demás variables (como el efecto marginal de un factor en ANOVA), entonces exp (

β_{1}

$\beta_1$ ) es el efecto multiplicativo marginal de

x_{1}

$x_1$ .

— gung - Restablece a Monica

Yo, como @gung, no estoy seguro de lo que estás tratando de hacer. Pero si desea comparar los resultados de los dos modelos, puede trazar los valores pronosticados de cada uno en un diagrama de dispersión. Comparar los coeficientes no tiene sentido.

— Peter Flom