Quiero incluir el término su cuadrado (variables predictoras) en una regresión porque supongo que los valores bajos de tienen un efecto positivo en la variable dependiente y los valores altos tienen un efecto negativo. La debería capturar el efecto de los valores más altos. Por lo tanto, espero que el coeficiente de sea positivo y el coeficiente de sea negativo. Además de , también incluyo otras variables predictoras.x 2 x x 2 x x 2 x
Leí en algunas publicaciones aquí que es una buena idea centrar las variables en este caso para evitar la multicolinealidad. Al realizar una regresión múltiple, ¿cuándo debería centrar sus variables predictoras y cuándo debería estandarizarlas?
¿Debería centrar ambas variables por separado (en la media) o debería centrar solo y luego tomar el cuadrado o debería centrar solo e incluir la original ?x 2 x
¿Es un problema si es una variable de conteo?
Para evitar que sea una variable de conteo, pensé en dividirla por un área teóricamente definida, por ejemplo 5 kilómetros cuadrados. Esto debería ser un poco similar a un cálculo de densidad de puntos.
Sin embargo, me temo que en esta situación mi suposición inicial sobre el signo de los coeficientes ya no se mantendría, como cuando y x² = 4
=
pero sería más pequeño porque .