Entiendo el concepto de escalar la matriz de datos para usar en un modelo de regresión lineal. Por ejemplo, en R podrías usar:
scaled.data <- scale(data, scale=TRUE)
Mi única pregunta es, para nuevas observaciones para las que quiero predecir los valores de salida, ¿cómo se escalan correctamente? ¿Sería scaled.new <- (new - mean(data)) / std(data)
?
y = y_esc * sd(y) + mean(y)
, hazlo , pero supongo que eso alteraría las propiedades del modelo, ¡así que también estoy esperando una respuesta más técnica!