¿Cuál es el significado intuitivo de tener una relación lineal entre los registros de dos variables?


20

Tengo dos variables que no muestran mucha correlación cuando se grafican entre sí tal como están, pero una relación lineal muy clara cuando trazo los registros de cada variable contra la otra.

Así que terminaría con un modelo del tipo:

log(Y)=alog(X)+b
, que es excelente matemáticamente pero no parece tener el valor explicativo de un modelo lineal regular.

¿Cómo puedo interpretar tal modelo?


55
No tengo nada sustancial que agregar a las respuestas existentes, pero un logaritmo en el resultado y el predictor es una elasticidad. Las búsquedas de ese término deberían encontrar algunos buenos recursos para interpretar esa relación, que no es muy intuitiva.
Upper_Case-Stop Harming Monica

La interpretación de un modelo log-log, donde la variable dependiente es log (y) y la variable independiente es log (x), es: %Δ=β1%Δx .
Bob

3
El enlace log-log complementario es una especificación GLM ideal cuando el resultado es binario (modelo de riesgo) y la exposición es acumulativa, como el número de parejas sexuales frente a la infección por VIH. jstor.org/stable/2532454
Adamo

2
@Alexis puede ver los puntos adhesivos si superpone las curvas. Trate curve(exp(-exp(x)), from=-5, to=5)vs curve(plogis(x), from=-5, to=5). La concavidad se acelera. Si el riesgo de evento de un solo encuentro fue , entonces el riesgo después del segundo evento debería ser y así sucesivamente, esa es una forma probabilística que el logit no capturará. Las exposiciones altas y altas sesgarían los resultados de la regresión logística de manera más dramática (falsamente de acuerdo con la regla de probabilidad previa). Algunas simulaciones te mostrarían esto. 1 - ( 1 - p ) 2p1(1p)2
AdamO

1
@AdamO Probablemente haya un documento pedagógico para ser escrito que incorpore dicha simulación que motive cómo elegir un enlace de resultado dicotómico particular de los tres, incluidas las situaciones en las que hace y no hace la diferencia.
Alexis

Respuestas:


27

Solo necesita tomar exponencial de ambos lados de la ecuación y obtendrá una relación potencial, que puede tener sentido para algunos datos.

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

Y dado que es solo un parámetro que puede tomar cualquier valor positivo, este modelo es equivalente a:eb

Y=cXa

Cabe señalar que la expresión del modelo debe incluir el término de error, y este cambio de variables tiene efectos interesantes sobre él:

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

Es decir, su modelo con errores aditivos que se ajustan a las condiciones de OLS (errores normalmente distribuidos con varianza constante) es equivalente a un modelo potencial con errores multiplicativos cuyo logaritmo sigue una distribución normal con varianza constante.


3
OP puede estar interesado en saber que esta distribución tiene un nombre, el log-normal: en.wikipedia.org/wiki/Log-normal_distribution
gardenhead

2
¿Qué pasa con el efecto de la desigualdad de Jensen? Generalmente para g convexo, E[g(X)]g(E[X])
Estadísticas

14

Puede tomar su log(Y)=alog(X)+b modelo ( Y ) = a log ( X ) + b y calcular el diferencial total, terminará con algo como:

1YdY=a1XdX
que rinde a
dYdXXY=a

Por lo tanto una interpretación sencilla del coeficiente de a será el porcentaje de cambio en Y para un porcentaje de cambio en X . Esto implica además que la variable Y crecimientos en una constante fracción ( a ) de la tasa de crecimiento de X .


Entonces, si el gráfico log-log es lineal, ¿eso implicaría una tasa de crecimiento constante?
Dimitriy V. Masterov

En realidad, no, la tasa de crecimiento de será constante si y solo si a = 0 . Ya=0
RScrlli

No con el tiempo, la tasa de crecimiento con respecto al crecimiento en x.
Dimitriy V. Masterov

reordenar no ayuda, lo eliminaría
Aksakal

1
@ DimitriyV.Masterov Ok, a continuación, ya que el es lineal en log ( X ) significa que la variable Y crece a una fracción constante de la tasa de crecimiento de X . ¿Hay algo mal con mi respuesta según usted? log(Y)log(X)YX
RScrlli

7

Intuitivamente log nos da el orden de magnitud de una variable, por lo que podemos ver la relación como los órdenes de magnitud de las dos variables están linealmente relacionados. Por ejemplo, aumentar el predictor en un orden de magnitud puede estar asociado con un aumento de tres órdenes de magnitud de la respuesta.

Al trazar usando un diagrama de log-log , esperamos ver una relación lineal. Usando un ejemplo de esta pregunta , podemos verificar los supuestos del modelo lineal:

log-log


3
+1 para una respuesta intuitiva a un concepto no intuitivo. Sin embargo, la imagen que ha incluido viola claramente la variación constante de error en el predictor.
Frans Rodenburg

1
La respuesta es correcta, pero la atribución de autor es incorrecta. La imagen no debe atribuirse a las imágenes de Google, sino, al menos, a la página web donde se encuentra, que se puede encontrar simplemente haciendo clic en las imágenes de Google.
Pere

@Pere desafortunadamente no puedo encontrar la fuente original de la imagen (al menos usando la búsqueda de imagen inversa)
qwr

Parece provenir originalmente de diagramss.us aunque ese sitio está caído y la mayoría de sus páginas no están en el Archivo Web, aparte de su página de inicio
Henry

4

Conciliar la respuesta de @Rscrill con datos discretos reales, considere

log(Yt)=alog(Xt)+b,log(Yt1)=alog(Xt1)+b

log(Yt)log(Yt1)=a[log(Xt)log(Xt1)]

Pero

log(Yt)log(Yt1)=log(YtYt1)log(Yt1+ΔYtYt1)=log(1+ΔYtYt1)

ΔYtYt1Yt1tYtgYt0.1

log(1+ΔYtYt1)ΔYtYt1=gYt

Por lo tanto obtenemos

gYtagXt

que valida en estudios empíricos el tratamiento teórico de @Rscrill.


1
Esto es probablemente lo que un matemático llamaría intuitivo :)
Richard Hardy

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.