Estoy tratando de predecir una variable de respuesta en regresión lineal que siempre debe ser positiva (costo por clic). Es una cantidad monetaria. En AdWords, usted paga a Google por los clics en sus anuncios, y un número negativo significaría que Google le paga cuando la gente hace clic: P
Los predictores son todos valores continuos. El Rsquared y el RMSE son decentes en comparación con otros modelos, incluso fuera de muestra:
RMSE Rsquared
1.4141477 0.8207303
No puedo reescalar las predicciones, porque es dinero, por lo que incluso un pequeño factor de reescalado podría cambiar los costos significativamente.
Por lo que entiendo, para el modelo de regresión no hay nada especial en los números cero y negativos, por lo que encuentra el mejor hiperplano de regresión sin importar si la salida es parcialmente negativa.
Este es un primer intento, usando todas las variables que tengo. Entonces hay espacio para el refinamiento.
¿Hay alguna forma de decirle al modelo que la salida no puede ser negativa?