Análisis de puntos de cambio

¿Podría alguien explicarme el cambio? Estoy usando el paquete en R, y realmente no entiendo qué significan los diferentes métodos, los pros y los contras de cada uno, y especialmente no entiendo el valor de la penalización. Cuando aumenta el valor de la penalización, ¿qué significa eso y qué hace? He realizado una buena cantidad de investigación en línea, pero sigo encontrando los sitios Cran R y R rápido, que son buenos, pero la forma en que lo dicen no es suficiente para mí.

Muchas gracias.

change-point

— Darla
fuente

¿Has leído esta documentación para el paquete changepoint ?

— Jeromy Anglim

Desafortunadamente, lo hice :(

— Darla

Hay 3 funciones principales en el paquete de punto de cambio cpt.mean, cpt.vary cpt.meanvar. Como profesional, estas son las únicas funciones en el paquete que debería necesitar. Si cree que sus datos pueden contener un cambio en la media, entonces usa la cpt.meanfunción, etc.

La siguiente pregunta que debe hacerse es si está buscando uno o varios cambios en sus datos. El methodargumento maneja esto, hay AMOC para At Most One Change, y PELT, BinSeg y SegNeigh para múltiples cambios. El método de múltiples puntos de cambio que desea utilizar depende de:

a) Su elección del método de distribución / distribución libre (ver más abajo) y

b) Cuánto tiempo tiene / qué tan precisa quiere que sea su respuesta. BinSeg es rápido pero aproximado, PELT es exacto y rápido pero no se puede usar en todas las distribuciones, SegNeigh es exacto pero lento.

La siguiente pregunta es qué suposiciones puede / está dispuesto a hacer sobre sus datos. La clave aquí es que la suposición se aplica a cada conjunto de datos entre cambios y no a todos los datos. Por ejemplo, es posible que pueda asumir una distribución Normal, pero si realiza una prueba de Normalidad en todos los datos, es muy probable que falle (debido a los posibles cambios). Por lo tanto, normalmente hacemos una suposición, ejecutamos el análisis del punto de cambio y luego verificamos las suposiciones en función de los cambios identificados. Nuevamente, dependiendo del tipo de cambio, hay diferentes métodos de distribución y sin distribución. Consulte la documentación de cada función para ver las opciones y siéntase libre de comentar qué estadística de prueba está pensando usar y puedo enumerar los supuestos.

Finalmente, miras la penalización. La penalización ofrece un compromiso entre muchos cambios pequeños y ningún cambio. Por lo tanto, si establece la penalización en 0, obtendrá un cambio en cada ubicación posible y si establece la penalización en infinito, no obtendrá cambios. El valor apropiado de la penalización depende de sus datos y la pregunta que desea responder. Por ejemplo, es posible que tenga cambios en la media de 0.5 unidades, pero puede que solo le interesen los cambios de 1+ unidades. Hay muchas formas de elegir su penalidad:

"a simple vista", es decir, pruebe algunos valores diferentes hasta que encuentre uno que parezca apropiado para su problema.
"diagrama de codo", es decir, el número de puntos de cambio identificados contra la penalización utilizada. Esto crea una curva por la cual los valores pequeños de la penalización producen cambios grandes (espurios) y, a medida que la penalización disminuye, estos cambios espurios disminuyen a una velocidad rápida, esta velocidad se desacelera ya que solo quedan cambios verdaderos antes de caer lentamente a ningún cambio para penalizaciones más grandes . La idea es ajustar 2 líneas rectas a esta curva y elegir la penalización donde se cruzan. Esto produce una forma ad-hoc pero más objetiva para elegir la penalización que 1.
usa un criterio de información. Hay algunos como AIC, BIC / SIC, Hannan-Quinn incluidos en el paquete. Hay otros que no están incluidos en el paquete, pero puede proporcionar una fórmula pen.valuesi lo desea.

Si necesita más información o aclaraciones sobre puntos específicos, solo comente y trataré de responder.

— adunaico
fuente

Eso es muy útil, gracias. Mi única cosa es que estoy realmente colgado del valor de la penalización. Qué significa eso? Cuando se conecta manualmente, ¿cómo interpreta un pen.value = .05 verso a pen.value = .40? ¿Qué dice eso sobre sus datos?

— Darla

El tamaño de pen.value es relativo a los datos en los que está trabajando, por lo que realmente no puede comparar un pen.value de 0.05 en un conjunto de datos con un pen.value de 0.4 en otro. Sin embargo, en el mismo conjunto de datos, la penalización más pequeña identificará más cambios y, por lo tanto, podrá identificar cambios más pequeños en los parámetros. El valor de penalización mayor busca cambios mayores antes de considerarlos "significativos".

— adunaic

Entonces, ¿cómo sé cuán significativo es significativo? Si pongo pen.value = .20 obtengo 8 puntos de cambio, pero si pongo pen.value = .30, solo obtengo 5 puntos de cambio. ¿Cómo sé si esos 3 puntos de cambio son significativos? ¿Cómo debo saber con qué valor seguir?

— Darla

véase la respuesta a la pregunta de nuevo a Deb: stats.stackexchange.com/questions/60245/...

— Adunaico

¿Cómo se realiza un análisis de punto de cambio continuo? ¿es eso posible?

— usuario1234440