No puedo interpretar este gráfico. Mi variable dependiente es el número total de entradas de cine que se venderán para un espectáculo. Las variables independientes son el número de días que quedan antes del espectáculo, las variables ficticias de estacionalidad (día de la semana, mes del año, vacaciones), precio, boletos vendidos hasta la fecha, clasificación de películas, tipo de película (suspenso, comedia, etc.) como muñecos. ) Además, tenga en cuenta que la capacidad de la sala de cine es fija. Es decir, puede alojar un máximo de x número de personas solamente. Estoy creando una solución de regresión lineal y no se ajusta a mis datos de prueba. Entonces pensé en comenzar con el diagnóstico de regresión. Los datos provienen de una sola sala de cine para la que quiero predecir la demanda.
El es un conjunto de datos multivariante. Para cada fecha, hay 90 filas duplicadas, que representan días antes del espectáculo. Entonces, para el 1 de enero de 2016 hay 90 registros. Hay una variable 'lead_time' que me da la cantidad de días antes del espectáculo. Entonces, para el 1 de enero de 2016, si lead_time tiene un valor de 5, significa que tendrá entradas vendidas hasta 5 días antes de la fecha del espectáculo. En la variable dependiente, total de boletos vendidos, tendré el mismo valor 90 veces.
Además, como comentario adicional, ¿hay algún libro que explique cómo interpretar la trama residual y mejorar el modelo después?