Interpretación del logaritmo transformador predictor y / o respuesta


46

Me pregunto si hace una diferencia en la interpretación si solo el dependiente, tanto el dependiente como el independiente, o solo las variables independientes se transforman logarítmicamente.

Considere el caso de

log(DV) = Intercept + B1*IV + Error 

Puedo interpretar el IV como el porcentaje de aumento, pero ¿cómo cambia esto cuando tengo

log(DV) = Intercept + B1*log(IV) + Error

o cuando tengo

DV = Intercept + B1*log(IV) + Error

?


1
Tengo la sensación de que la interpretación del "aumento porcentual" no es correcta, pero no tengo suficiente comprensión para decir exactamente por qué. Espero que alguien pueda ayudar ... Más allá de eso, recomendaría modelar usando registros si ayudan a establecer mejor una relación XY, pero informando ejemplos seleccionados de esa relación usando las variables originales. Especialmente si se trata de una audiencia que no es muy experta técnicamente.
rolando2

3
@ rolando2: no estoy de acuerdo. Si un modelo válido requiere transformación, una interpretación válida generalmente dependerá de los coeficientes del modelo transformado. Sigue siendo responsabilidad del investigador comunicar adecuadamente el significado de esos coeficientes a la audiencia. Esa es, por supuesto, la razón por la que nos pagan tanto dinero que los salarios tienen que ser transformados en primer lugar.
jthetzel

1
@BigBucks: Bueno, míralo de esta manera. Suponga que su audiencia simplemente no puede entender lo que quiere decir cuando explica que por cada cambio de 1 en el registro (base 10) de X, Y cambiará por b. Pero suponga que pueden entender 3 ejemplos usando valores X de 10, 100 y 1000. En ese punto, probablemente captarán la naturaleza no lineal de la relación. Aún podría informar el b general, basado en el registro, pero dar esos ejemplos podría marcar la diferencia.
rolando2

1
.... Aunque ahora que leí su gran explicación a continuación, tal vez usar esas "plantillas" podría ayudarnos a muchos de nosotros a aclarar este tipo de problemas en la comprensión.
rolando2

Respuestas:


42

Charlie ofrece una explicación agradable y correcta. El sitio de Computación Estadística en UCLA tiene algunos ejemplos adicionales: http://www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htm , y http://www.ats.ucla.edu/stat/mult_pkg/ faq / general / log_transformed_regression.htm

Solo para complementar la respuesta de Charlie, a continuación hay interpretaciones específicas de sus ejemplos. Como siempre, las interpretaciones de coeficientes suponen que puede defender su modelo, que los diagnósticos de regresión son satisfactorios y que los datos provienen de un estudio válido.

Ejemplo A : sin transformaciones

DV = Intercept + B1 * IV + Error 

"El aumento de una unidad en IV está asociado con un ( B1) aumento de unidad en DV".

Ejemplo B : Resultado transformado

log(DV) = Intercept + B1 * IV + Error 

"Un aumento de una unidad en IV se asocia con un ( B1 * 100) porcentaje de aumento en DV".

Ejemplo C : exposición transformada

DV = Intercept + B1 * log(IV) + Error 

"Un aumento del uno por ciento en IV se asocia con un ( B1 / 100) aumento de la unidad en DV".

Ejemplo D : Resultado transformado y exposición transformada

log(DV) = Intercept + B1 * log(IV) + Error 

"Un aumento del uno por ciento en IV se asocia con un B1aumento del ( ) por ciento en DV".


1
¿Estas interpretaciones se mantienen independientemente de la base del logaritmo?
Ayalew A.

Ejemplo B: Log transformado de resultado (DV) = Intercepción + B1 * IV + Error "Un aumento de unidad en IV se asocia con un aumento porcentual (B1 * 100) en DV En este caso, ¿cómo lo hace si desea 30 por ciento de DV reducción? Gracias por su respuesta
Antouria 03 de

Entonces, ¿un registro DV ~ B1 * (IV) es un buen modelo para la variable dependiente continua con límite cero?
Bakaburg el

2
Puedo estar confundido Si log-transforma el resultado, debe volver a exponer el coeficiente para encontrar la diferencia multiplicativa. Interpretarlo en la escala logarítmica solo funciona como una aproximación cuando la relación es muy cercana a 1.
AdamO

Los enlaces están rotos.
Nick Cox

22

β1=Iniciar sesión(y)Iniciar sesión(X).
Iniciar sesión(y)y=1y
Iniciar sesión(y)=yy.
yX

β1yX

Siguiendo la misma lógica, para el modelo de registro de nivel, tenemos

β1=yIniciar sesión(X)=100y100×Iniciar sesión(X).
β1/ /100yX

Iniciar sesión(y)=yy?

1
Todo lo que hace esa línea es tomar la derivada de con respecto aIniciar sesión(y)yyyy1-y0 0yyy

7

El objetivo principal de la regresión lineal es estimar una diferencia media de resultados comparando niveles adyacentes de un regresor. Hay muchos tipos de medios. Estamos más familiarizados con la media aritmética.

UNAMETRO(X)=(X1+X2+...+Xnorte)norte

El AM es lo que se estima utilizando OLS y variables no transformadas. La media geométrica es diferente:

solMETRO(X)=(X1×X2×...×Xnorte)norte=Exp(UNAMETRO(Iniciar sesión(X))

ingrese la descripción de la imagen aquí

Prácticamente una diferencia de GM es una diferencia multiplicativa: usted paga X% de una prima en intereses al asumir un préstamo, sus niveles de hemoglobina disminuyen X% después de comenzar con metformina, la tasa de falla de los resortes aumenta X% como una fracción del ancho. En todos estos casos, una diferencia media bruta tiene menos sentido.

log(y) ~ xβ1Xmiβ1

miβ1=0,40

Esta es una distinción importante de otras respuestas : la convención de multiplicar el coeficiente de escala logarítmica por 100 proviene del log de aproximación ( x ) 1 - xIniciar sesión(X)1-XXExp(0,05)1.05XExp(0.5 0.5)=1,65YX

y ~ log(x, base=2)XXβ1

Por último, log(y) ~ log(x)simplemente aplica ambas definiciones para obtener una diferencia multiplicativa que compara grupos que difieren multiplicativamente en los niveles de exposición.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.