Pensando en un problema supuestamente simple pero interesante, me gustaría escribir un código para pronosticar los consumibles que necesitaré en el futuro cercano dado el historial completo de mis compras anteriores. Estoy seguro de que este tipo de problema tiene una definición más genérica y bien estudiada (alguien sugirió que esto está relacionado con algunos conceptos en sistemas ERP y similares).
Los datos que tengo son el historial completo de compras anteriores. Digamos que estoy viendo suministros de papel, mis datos se ven como (fecha, hojas):
2007-05-10 500
2007-11-11 1000
2007-12-18 1000
2008-03-25 500
2008-05-28 2000
2008-10-31 1500
2009-03-20 1500
2009-06-30 1000
2009-09-29 500
2009-12-16 1500
2010-05-31 500
2010-06-30 500
2010-09-30 1500
2011-05-31 1000
no se 'muestrea' a intervalos regulares, por lo que creo que no califica como datos de series temporales .
No tengo datos sobre los niveles de existencias reales cada vez. Me gustaría utilizar estos datos simples y limitados para predecir cuánto papel necesitaré en (por ejemplo) 3,6,12 meses.
Hasta ahora llegué a saber que lo que estoy buscando se llama Extrapolación y no mucho más :)
¿Qué algoritmo podría usarse en tal situación?
¿Y qué algoritmo, si es diferente del anterior, también podría aprovechar algunos puntos de datos más que dan los niveles de suministro actuales (por ejemplo, si sé que en la fecha XI me quedaban hojas de papel Y)?
Siéntase libre de editar la pregunta, el título y las etiquetas si conoce una mejor terminología para esto.
EDITAR: por lo que vale, intentaré codificar esto en python. Sé que hay muchas bibliotecas que implementan más o menos cualquier algoritmo por ahí. En esta pregunta, me gustaría explorar los conceptos y las técnicas que podrían usarse, con la implementación real que se dejará como ejercicio para el lector.