Recientemente estaba buscando formas de volver a muestrear series temporales, de manera que
- Preservar aproximadamente la autocorrelación de los procesos de memoria larga.
- Preservar el dominio de las observaciones (por ejemplo, una serie de enteros de muestras repetidas sigue siendo una serie de enteros).
- Puede afectar solo algunas escalas, si es necesario.
Se me ocurrió el siguiente esquema de permutación para una serie temporal de longitud :
- Bin la serie de tiempo por pares de observaciones consecutivas (hay tales contenedores). Voltear cada uno de ellos ( es decir, índice de a ) de forma independiente con una probabilidad de 1 / 2 .
1:2
2:1
- Bin las series de tiempo obtenidas por observaciones consecutivas (hay 2 N - 2 tales contenedores). Invierta cada uno de ellos ( es decir, índice de a ) independientemente con probabilidad 1 /
1:2:3:4
4:3:2:1
. - Repetir el procedimiento con los compartimientos del tamaño , 16 , ..., 2 N - 1 siempre invirtiendo los contenedores con probabilidad 1 / 2 .
Este diseño era puramente empírico y estoy buscando trabajo que ya se hubiera publicado sobre este tipo de permutación. También estoy abierto a sugerencias para otras permutaciones o esquemas de remuestreo.
Su procedimiento es interesante, pero a medida que lo describe, me parece que si es el tamaño máximo de bloque, básicamente divide sus datos en 2 ( N - k ) bloques consecutivos y luego dentro de cada par de permuta de bloque, siendo cada instancia igual -probable.
—
muratoa
En lugar de pares, podría definir y k max . De esta manera se asegura que se conservan al menos 2 k min puntos y se puede mover una distancia como máximo 2 k máx .
—
muratoa
@muratoa gracias por sus comentarios. No estoy seguro de seguirlo. Si es el tamaño máximo de bloque, el esquema no es como permutar pares dentro de bloques. Por ejemplo, para k = 2 , puede obtener el orden con probabilidad 1/8, que no es un par de permutación. En cuanto a k min y k max , esto es a lo que me refiero en el punto 3. Esta es la forma de barajar escalas de k min y k max .
—
gui11aume
4:3:2:1
Google "datos sustitutos ajustados a la amplitud" creados por James Theiler y / o eche un vistazo a Métodos de remuestreo de datos dependientes por Lahiri.
—
PeterR
tienes razón, no leí tu primera viñeta correctamente, pensé que el tamaño mínimo era 2.
—
muratoa