No recomendaría el enfoque utilizado por Neal et al. . Sus datos son únicos por dos razones:
Están trabajando con datos de alimentos, que generalmente son más densos y más estables que otros datos de productos minoristas. Un lugar determinado estará vendiendo docenas de cartones de leche o paquetes de huevos por semana y habrá estado vendiendo esos mismos productos durante décadas, en comparación con la moda o las piezas de automóviles, donde no es raro tener ventas de un solo artículo cada 3 o 4 semanas, y datos disponibles por solo un año o dos.
Están pronosticando almacenes, no tiendas. Un único almacén cubre varias tiendas, por lo que sus datos son aún más densos que el promedio. De hecho, un almacén se usa típicamente como un nivel de agregación / agrupación natural para las tiendas, por lo que ya están esencialmente realizando una agrupación de datos de la tienda.
Debido a la naturaleza de sus datos, pueden salirse con la suya modelando series de tiempo individuales directamente. Pero la información de la mayoría de los minoristas sería demasiado escasa a nivel de sku / tienda individual para que puedan lograrlo.
Como dijo zbicyclist, este problema generalmente se aborda mediante pronósticos jerárquicos o de niveles múltiples . Todos los paquetes de pronóstico de demanda comercial utilizan alguna forma de pronóstico jerárquico
La idea es agrupar productos y tiendas en productos y regiones similares, para los cuales se generan pronósticos agregados y se utilizan para determinar la estacionalidad y tendencia general, que luego se distribuyen conciliados utilizando un enfoque de arriba hacia abajo con los pronósticos de línea de base generados para cada sku individual / tienda de combinación.
Además del desafío mencionado por zbicyclist, un problema mayor es que encontrar las agrupaciones óptimas de productos y tiendas no es una tarea trivial, que requiere una combinación de experiencia en el dominio y análisis empírico. Los productos y las tiendas generalmente se agrupan en jerarquías elaboradas (por departamento, proveedor, marca, etc. para productos, por región, clima, almacén, etc. para ubicación) que luego se envían al algoritmo de pronóstico junto con las ventas históricas. datos en sí.
Abordar comentarios de meraxes
¿Qué hay de los métodos utilizados en la Competencia Kaggle de Previsión de Ventas de Comestibles de Corporación Favorita, donde permiten que los modelos aprendan de los historiales de ventas de varios productos (posiblemente no relacionados), sin hacer ningún agrupamiento explícito? ¿Sigue siendo un enfoque válido?
Están haciendo la agrupación implícitamente usando store, item, famlily, class, cluster como características categóricas.
Acabo de leer un poco de la sección de Rob Hyndman sobre pronósticos jerárquicos. Me parece que hacer un enfoque de arriba hacia abajo proporciona pronósticos confiables para los niveles agregados; sin embargo, tiene la gran desventaja de perder información debido a la agregación que puede afectar los pronósticos para los nodos de nivel inferior. También puede ser "incapaz de capturar y aprovechar las características de series individuales como la dinámica del tiempo, eventos especiales".
Tres puntos con respecto a esto:
- La desventaja a la que apunta depende de la agrupación de los datos. Si agrega todos los productos y tiendas, entonces sí, esto sería un problema. Por ejemplo, agregar todas las tiendas de todas las regiones enturbiaría cualquier estacionalidad específica de la región. Pero debe agregarse solo a la agrupación relevante, y como señalé, esto requerirá un poco de análisis y experimentación para encontrarlo.
- En el caso específico de la demanda minorista, no nos preocupa "perder información debido a la agregación" porque con frecuencia las series de tiempo en los nodos inferiores (es decir, SKU / Tienda) contienen muy poca información, por lo que las agregamos a las más altas. niveles en primer lugar.
- Para los eventos específicos de SKU / tienda, la forma en que lo abordamos en mi equipo es eliminar los efectos específicos del evento antes de generar un pronóstico y luego agregarlos nuevamente más tarde, después de que se genere el pronóstico. Ver aquí para más detalles.