Desestacionalizar datos de recuento


12

Usé stl () en R para descomponer los datos de conteo en componentes de tendencia, estacionales e irregulares. Los valores de tendencia resultantes ya no son enteros. Tengo las siguientes preguntas:

  1. ¿Es stl () una forma adecuada de desestacionalizar los datos de conteo?
  2. Dado que la tendencia resultante ya no tiene un valor entero, ¿puedo usar lm () para modelar los componentes de la tendencia?

Respuestas:


8

No hay ningún problema inherente con el uso de stl () para desestacionalizar los datos de conteo. Sin embargo, una cuestión a tener en cuenta es que los datos de recuento generalmente tienen una variación creciente a medida que aumenta la media. Esto se ve a menudo en los elementos estacionales y aleatorios de la descomposición. El uso de stl () en los datos sin procesar no tendrá esto en cuenta y, por lo tanto, puede ser mejor tomar primero el logaritmo (edición o raíz cuadrada) de sus datos.

No importa que los valores de tendencia ya no sean enteros. Pueden pensarse de manera similar al parámetro en una distribución de Poisson. Aunque una variable distribuida de Poisson debe ser un número entero, la media no necesita serlo.

Sin embargo, esto no significa necesariamente que pueda usar lm () para modelar el componente de tendencia. Existen muchas dificultades en el modelado de tendencias en series de tiempo, ya que las correlaciones espurias serán muy difíciles de evitar. Más comúnmente, las personas primero descifran la serie y luego modelan la parte residual.


1
¿Cómo se determina cuántas tendencias hay que tener en cuenta y la duración de cada tendencia? ¿Distingue entre cambios de nivel y tendencias y, en general, cómo se tiende en presencia de valores atípicos / atípicos?
IrishStat

@IrishStat: sí, esos son todos buenos puntos y no estaba tratando de abordar el conjunto completo de problemas, solo llamo la atención sobre los problemas de usar el componente de tendencia de la salida de R's stl () como la variable de respuesta en una regresión . stl () utiliza la regresión ponderada localmente en su descomposición que generalmente da resultados sensibles cuando se trata de tendencias que cambian de dirección, etc., aunque, por supuesto, tiene limitaciones en comparación con los métodos basados ​​en modelos, particularmente para el pronóstico.
Peter Ellis
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.