¿Cuándo (y por qué) debería tomar el registro de una distribución (de números)?


174

Digamos que tengo algunos datos históricos, por ejemplo, precios de acciones anteriores, fluctuaciones de precios de pasajes aéreos, datos financieros anteriores de la empresa ...

Ahora alguien (o alguna fórmula) aparece y dice "tomemos / usemos el registro de la distribución" y aquí es donde voy POR QUÉ ?

Preguntas:

  1. ¿POR QUÉ se debe tomar el registro de la distribución en primer lugar?
  2. ¿QUÉ 'da / simplifica' el registro de la distribución que la distribución original no pudo / no hizo?
  3. ¿La transformación logarítmica es 'sin pérdidas'? Es decir, al transformarse en espacio de registro y analizar los datos, ¿se mantienen las mismas conclusiones para la distribución original? ¿Cómo?
  4. Y por último, ¿CUÁNDO tomar el registro de la distribución? ¿En qué condiciones se decide hacer esto?

Realmente quería entender las distribuciones basadas en registros (por ejemplo, lognormal) pero nunca entendí los aspectos cuándo / por qué, es decir, el registro de la distribución es una distribución normal, ¿y qué? ¿Qué nos dice eso y a mí y por qué molestarse? De ahí la pregunta!

ACTUALIZAR : Según el comentario de @ whuber, miré las publicaciones y, por alguna razón, entiendo el uso de las transformaciones de registro y su aplicación en la regresión lineal, ya que puede establecer una relación entre la variable independiente y el registro de la variable dependiente. Sin embargo, mi pregunta es genérica en el sentido de analizar la distribución en sí misma: no existe una relación per se que pueda concluir para ayudar a comprender la razón de tomar registros para analizar una distribución. Espero tener sentido: - /

En el análisis de regresión, usted tiene restricciones sobre el tipo / ajuste / distribución de los datos y puede transformarlos y definir una relación entre la variable dependiente independiente y (no transformada). Pero cuándo / por qué se haría eso para una distribución aislada donde las restricciones de tipo / ajuste / distribución no son necesariamente aplicables en un marco (como la regresión). Espero que la aclaración haga las cosas más claras que confusas :)

Esta pregunta merece una respuesta clara en cuanto a "POR QUÉ y CUÁNDO"


3
Debido a que esto cubre casi el mismo terreno que las preguntas anteriores aquí y aquí , lea esos hilos y actualice su pregunta para centrarse en cualquier aspecto de este problema que aún no se haya abordado. Tenga en cuenta, también, que el # 4 (y parte del # 3) son preguntas elementales sobre logaritmos cuyas respuestas se encuentran fácilmente en muchos lugares.
whuber

1
La aclaración ayuda. Sin embargo, es posible que desee considerar el hecho de que la regresión con solo un término constante (y sin otras variables independientes) equivale a evaluar la variación de los datos en torno a su media. Por lo tanto, si realmente comprende los efectos de tomar registros de variables dependientes en regresión, ya comprende la situación (más simple) que está preguntando aquí. En resumen, una vez que tenga respuestas a las cuatro preguntas para la regresión, no necesita volver a preguntarlas sobre "la distribución aislada".
whuber

@whuber: Ya veo ... así que entiendo las razones para tomar registros en regresión, pero solo porque me lo enseñaron, lo entiendo por la necesidad de hacerlo desde una perspectiva, es decir, para asegurarme de que los datos se ajustan a los supuestos de regresión lineal. Esa es mi única comprensión. Quizás lo que me falta es la "comprensión real" del efecto de tomar registros y, por lo tanto, la confusión ... ¿alguna ayuda? ;)
Doctorado

2
Ah, pero sabes mucho más que eso, porque después de usar los registros en la regresión, sabes que los resultados se interpretan de manera diferente y sabes que debes tener cuidado al transformar los valores ajustados y los intervalos de confianza. Le sugiero que no se confunda y que probablemente ya sepa muchas de las respuestas a estas cuatro preguntas, a pesar de que inicialmente no lo sabía :-).
whuber

Respuestas:


98

Si asume una forma de modelo que no es lineal pero puede transformarse en un modelo lineal como Iniciar sesiónY=β0 0+β1t , se justificaría tomar logaritmos de Y para cumplir con la forma de modelo especificada. En general, tenga o no series causales, el único momento en que estaría justificado o correcto al tomar el Log de Y es cuando se puede demostrar que la Varianza de Y es proporcional al Valor esperado de Y2. No recuerdo la fuente original de lo siguiente, pero resume muy bien el papel de las transformaciones de poder. Es importante tener en cuenta que los supuestos de distribución siempre se refieren al proceso de error, no a la Y observada, por lo tanto, es un "no-no" definitivo analizar la serie original para una transformación apropiada a menos que la serie se defina por una constante simple.

Las transformaciones injustificadas o incorrectas, incluidas las diferencias, deben evitarse cuidadosamente, ya que a menudo son un intento mal concebido / mal concebido para tratar anomalías no identificadas / cambios de nivel / tendencias de tiempo o cambios en los parámetros o cambios en la varianza del error. Un ejemplo clásico de esto se discute comenzando en la diapositiva 60 aquí http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting/doc_download/53-capabilities-presentation donde tres anomalías de pulso ( sin tratamiento) condujo a una transformación de registro injustificada por los primeros investigadores. Lamentablemente, algunos de nuestros investigadores actuales siguen cometiendo el mismo error.

La transformación de potencia óptima se encuentra a través de la Prueba Box-Cox donde

  • -1. es recíproco
  • -.5 es una raíz cuadrada recriprocal
  • 0.0 es una transformación logarítmica
  • .5 es una transformación de punta cuadrada y
  • 1.0 no es transformar.

Yt=tu+unatYunatunatYtunatYtYYYXYXIniciar sesiónYIniciar sesiónX. En resumen, las transformaciones son como drogas, ¡algunas son buenas y otras son malas para ti! Solo deben usarse cuando sea necesario y luego con precaución.


2
Estoy de acuerdo en que quien haya dejado el voto negativo (s) debe dejar un comentario sobre por qué esto fue rechazado. Para Irishstat, sería mucho más fácil leer su publicación si aprovechara las opciones de formato para dejar respuestas, especialmente las disponibles para marcar ecuaciones en látex. Consulte la sección de ayuda de edición de rebajas . Ese enlace está disponible cada vez que escribe una respuesta en la esquina superior derecha del cuadro de publicación (en el círculo naranja con el signo de interrogación).
Andy W

44
La tabla citada se encuentra en Introducción al análisis de regresión lineal por Douglas C. Montgomery, Elizabeth A. Peck, G. Geoffrey Vining.
user1717828

@ user1717828 tu .. Siempre he sido fanático de Montgomery ya que tiene una larga barba que involucra series de tiempo
IrishStat

¿No es siempre cierto que el segundo momento y la varianza son proporcionales entre sí? Tenemos la ecuación clásica que dice: la varianza es igual al segundo momento menos el primer momento al cuadrado.
información

Como dices, la varianza es una función del segundo momento. ¿Dónde implicaba lo contrario? Además, la variación puede cambiar (de manera determinista) en diferentes puntos en el tiempo VER pdfs.semanticscholar.org/09c4/… que no se remedia con una transformación de potencia.
IrishStat

108

La escala logarítmica informa sobre los cambios relativos (multiplicativos), mientras que la escala lineal informa sobre los cambios absolutos (aditivos). ¿Cuándo usas cada uno? Cuando le interesan los cambios relativos, use la escala logarítmica; cuando te interesan los cambios absolutos, usa la escala lineal. Esto es cierto para las distribuciones, pero también para cualquier cantidad o cambio en las cantidades.

Tenga en cuenta que uso la palabra "cuidado" aquí de manera muy específica e intencional. Sin un modelo o una meta, su pregunta no puede ser respondida; El modelo u objetivo define qué escala es importante. Si está tratando de modelar algo, y el mecanismo actúa a través de un cambio relativo, la escala logarítmica es crítica para capturar el comportamiento visto en sus datos. Pero si el mecanismo del modelo subyacente es aditivo, querrás usar una escala lineal.


PSPSPS


PSPSPSPS


PS

Si convertimos al espacio de registro, los cambios relativos aparecen como cambios absolutos.

Iniciar sesión10(PS1)Iniciar sesión10(PS1.10)
Iniciar sesión10(PS100)Iniciar sesión10(PS110)

Ahora, tomando la diferencia absoluta en el espacio logarítmico , encontramos que ambos cambiaron en .0413.

Ambas medidas de cambio son importantes, y cuál es importante para usted depende únicamente de su modelo de inversión. Hay dos modelos (1) Invertir una cantidad fija de capital, o (2) invertir en un número fijo de acciones.

Modelo 1: Invertir con una cantidad fija de capital.

PSPSPSPSPSPSPSPS

Modelo 2: número fijo de acciones.

PS

Ahora supongamos que pensamos en el valor de una acción como una variable aleatoria que fluctúa con el tiempo, y queremos llegar a un modelo que refleje en general cómo se comportan las acciones. Y digamos que queremos usar este modelo para maximizar las ganancias. Calculamos una distribución de probabilidad cuyos valores de x están en unidades de 'precio de la acción', y valores de y en probabilidad de observar un precio de la acción dado. Hacemos esto para el stock A y el stock B. Si se suscribe al primer escenario, donde tiene una cantidad fija de capital que desea invertir, tomar el registro de estas distribuciones será informativo. ¿Por qué? Lo que le importa es la forma de la distribución en el espacio relativo. Si una acción va de 1 a 10, o de 10 a 100 no le importa, ¿verdad? Ambos casos son 10 vecesganancia relativa Esto aparece naturalmente en una distribución a escala logarítmica en la que las ganancias unitarias corresponden a las ganancias de plegado directamente. Para dos acciones cuyo valor medio es diferente pero cuyo cambio relativo se distribuye de manera idéntica (tienen la misma distribución de los cambios porcentuales diarios ), sus distribuciones logarítmicas serán idénticas en su forma recién desplazada. Por el contrario, sus distribuciones lineales no tendrán una forma idéntica, y la distribución de mayor valor tendrá una mayor varianza.

Si observara estas mismas distribuciones en un espacio lineal o absoluto, pensaría que los precios de las acciones de mayor valor corresponden a mayores fluctuaciones. Sin embargo, para sus propósitos de inversión, donde solo importan las ganancias relativas, esto no es necesariamente cierto.

Ejemplo 2. Reacciones químicas. Supongamos que tenemos dos moléculas A y B que sufren una reacción reversible.

UNAsi

que se define por las constantes de velocidad individuales

kunasiUNAsiksiunasiUNA

Su equilibrio está definido por la relación:

K=kunasiksiuna=[UNA][si]

UNAsi

K=kunasi-ksiuna=[UNA]-[si]

(0 0,inf)

EDITAR . Un paralelo interesante que me ayudó a construir la intuición es el ejemplo de los medios aritméticos frente a los medios geométricos.. Una media aritmética (vainilla) calcula el promedio de números suponiendo un modelo oculto donde las diferencias absolutas son lo que importa. Ejemplo. La media aritmética de 1 y 100 es 50.5. Sin embargo, supongamos que estamos hablando de concentraciones, donde la relación química entre las concentraciones es multiplicativa. Entonces, la concentración promedio debería calcularse realmente en la escala logarítmica. Esto se llama el promedio geométrico. ¡El promedio geométrico de 1 y 100 es 10! En términos de diferencias relativas, esto tiene sentido: 10/1 = 10 y 100/10 = 10, es decir, el cambio relativo entre el promedio y los dos valores es el mismo. Aditivamente encontramos lo mismo; 50.5-1 = 49.5 y 100-50.5 = 49.5.


2
Esta es una respuesta realmente útil y me encantan los ejemplos. ¿Podría agregar más sobre "cuándo" específicamente para usar log-transform? Usted dice "Cuando le interesan los cambios relativos, use la escala logarítmica; cuando le interesen los cambios absolutos, use la escala lineal". Pero, ¿hay casos en los que le importan los cambios relativos, pero no debería transformar los registros, y si es así, cómo detecta esos casos? Por ejemplo, este artículo expone
skeller88

@ skeller88 Estoy de acuerdo con este documento; es una respuesta limitada a la pregunta más amplia (¡y filosófica!) de "¿por qué transformamos las distribuciones?" Creo que la respuesta es que tenemos un conjunto de herramientas estadísticas bien desarrollado para contrastar entre distribuciones normales, pero un conjunto de herramientas menos desarrollado para otras distribuciones, quizás incluso sin nombre (la mayoría). Un enfoque para evaluar una distribución de aspecto funky podría ser tomar el registro de ella solo para ver si se ve más normal; pero como IrishStat describe técnicamente arriba, este camino está lleno de peligros (de la clavija cuadrada, variedad de orificios redondos).
vector07

1
Hay una explicación relevante de este efecto y por qué es importante para los árboles de decisión un poco más haciadatascience.com/…
Keith
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.