¿En qué circunstancias desearía, o no, escalar o estandarizar una variable antes del ajuste del modelo? ¿Y cuáles son las ventajas / desventajas de escalar una variable?
¿En qué circunstancias desearía, o no, escalar o estandarizar una variable antes del ajuste del modelo? ¿Y cuáles son las ventajas / desventajas de escalar una variable?
Respuestas:
La estandarización tiene que ver con los pesos de diferentes variables para el modelo. Si hace la estandarización "solo" en aras de la estabilidad numérica, puede haber transformaciones que produzcan propiedades numéricas muy similares pero diferentes significados físicos que podrían ser mucho más apropiados para la interpretación. Lo mismo es cierto para el centrado, que generalmente es parte de la estandarización.
Situaciones en las que probablemente desee estandarizar:
Situaciones en las que es posible que no desee estandarizar:
Puede hacer algo "en el medio" y transformar las variables o elegir la unidad para que las nuevas variables sigan teniendo un significado físico pero la variación en el valor numérico no sea tan diferente, p. Ej.
Similar para centrar:
En general, no recomiendo escalar o estandarizar a menos que sea absolutamente necesario. La ventaja o el atractivo de dicho proceso es que, cuando una variable explicativa tiene una dimensión física y una magnitud totalmente diferentes de la variable de respuesta, el escalado a través de la división por desviación estándar puede ayudar en términos de estabilidad numérica, y permite comparar efectos a través de múltiples variables explicativas. Con la estandarización más común, el efecto variable es la cantidad de cambio en la variable de respuesta cuando la variable explicativa aumenta en una desviación estándar; también indica que el significado del efecto variable (la cantidad de cambio en la variable de respuesta cuando la variable explicativa aumenta en una unidad) se perdería aunque el valor estadístico para la variable explicativa permanece sin cambios. Sin embargo, cuando se considera la interacción en un modelo, la escala podría ser muy problemática incluso para las pruebas estadísticas debido a una complicación que implica un ajuste de escala estocástico al calcular el error estándar del efecto de interacción (Preacher, 2003). Por esta razón, generalmente no se recomienda escalar por desviación estándar (o estandarización / normalización), especialmente cuando hay interacciones involucradas.
Preacher, KJ, Curran, PJ y Bauer, DJ, 2006. Herramientas computacionales para probar los efectos de interacción en regresión lineal múltiple, modelado multinivel y análisis de curva latente. Journal of Educational and Behavioral Statistics, 31 (4), 437-448.