Hay 3 funciones principales en el paquete de punto de cambio cpt.mean
, cpt.var
y cpt.meanvar
. Como profesional, estas son las únicas funciones en el paquete que debería necesitar. Si cree que sus datos pueden contener un cambio en la media, entonces usa la cpt.mean
función, etc.
La siguiente pregunta que debe hacerse es si está buscando uno o varios cambios en sus datos. El method
argumento maneja esto, hay AMOC para At Most One Change, y PELT, BinSeg y SegNeigh para múltiples cambios. El método de múltiples puntos de cambio que desea utilizar depende de:
a) Su elección del método de distribución / distribución libre (ver más abajo) y
b) Cuánto tiempo tiene / qué tan precisa quiere que sea su respuesta. BinSeg es rápido pero aproximado, PELT es exacto y rápido pero no se puede usar en todas las distribuciones, SegNeigh es exacto pero lento.
La siguiente pregunta es qué suposiciones puede / está dispuesto a hacer sobre sus datos. La clave aquí es que la suposición se aplica a cada conjunto de datos entre cambios y no a todos los datos. Por ejemplo, es posible que pueda asumir una distribución Normal, pero si realiza una prueba de Normalidad en todos los datos, es muy probable que falle (debido a los posibles cambios). Por lo tanto, normalmente hacemos una suposición, ejecutamos el análisis del punto de cambio y luego verificamos las suposiciones en función de los cambios identificados. Nuevamente, dependiendo del tipo de cambio, hay diferentes métodos de distribución y sin distribución. Consulte la documentación de cada función para ver las opciones y siéntase libre de comentar qué estadística de prueba está pensando usar y puedo enumerar los supuestos.
Finalmente, miras la penalización. La penalización ofrece un compromiso entre muchos cambios pequeños y ningún cambio. Por lo tanto, si establece la penalización en 0, obtendrá un cambio en cada ubicación posible y si establece la penalización en infinito, no obtendrá cambios. El valor apropiado de la penalización depende de sus datos y la pregunta que desea responder. Por ejemplo, es posible que tenga cambios en la media de 0.5 unidades, pero puede que solo le interesen los cambios de 1+ unidades. Hay muchas formas de elegir su penalidad:
"a simple vista", es decir, pruebe algunos valores diferentes hasta que encuentre uno que parezca apropiado para su problema.
"diagrama de codo", es decir, el número de puntos de cambio identificados contra la penalización utilizada. Esto crea una curva por la cual los valores pequeños de la penalización producen cambios grandes (espurios) y, a medida que la penalización disminuye, estos cambios espurios disminuyen a una velocidad rápida, esta velocidad se desacelera ya que solo quedan cambios verdaderos antes de caer lentamente a ningún cambio para penalizaciones más grandes . La idea es ajustar 2 líneas rectas a esta curva y elegir la penalización donde se cruzan. Esto produce una forma ad-hoc pero más objetiva para elegir la penalización que 1.
usa un criterio de información. Hay algunos como AIC, BIC / SIC, Hannan-Quinn incluidos en el paquete. Hay otros que no están incluidos en el paquete, pero puede proporcionar una fórmula pen.value
si lo desea.
Si necesita más información o aclaraciones sobre puntos específicos, solo comente y trataré de responder.