La correlación mide la relación lineal. En el contexto informal, la relación significa algo estable. Cuando calculamos la correlación de muestra para variables estacionarias y aumentamos el número de puntos de datos disponibles, esta correlación de muestra tiende a una correlación verdadera.
Se puede demostrar que para los precios, que generalmente son caminatas aleatorias, la correlación muestral tiende a una variable aleatoria. Esto significa que no importa cuántos datos tengamos, el resultado siempre será diferente.
Tenga en cuenta que intenté expresar la intuición matemática sin las matemáticas. Desde el punto de vista matemático, la explicación es muy clara: los momentos de muestra de procesos estacionarios convergen en probabilidad a constantes. Los momentos de muestra de caminatas aleatorias convergen en integrales de movimiento browniano que son variables aleatorias. Dado que la relación generalmente se expresa como un número y no como una variable aleatoria, la razón para no calcular la correlación para las variables no estacionarias se hace evidente.
Actualización Dado que estamos interesados en la correlación entre dos variables, supongamos primero que provienen del proceso estacionario . La estacionariedad implica que y no dependen de . Entonces correlaciónE Z t c o v ( Z t , Z t - h ) tZt=(Xt,Yt)EZtcov(Zt,Zt−h)t
corr(Xt,Yt)=cov(Xt,Yt)DXtDYt−−−−−−−√
tampoco depende de , ya que todas las cantidades en la fórmula provienen de la matriz , que no depende de . Entonces el cálculo de la correlación muestralc o v ( Z t ) ttcov(Zt)t
ρ=corr(Xt,Yt)ρ→ρT→∞√
ρ^= 1T∑Tt = 1( Xt- X¯) ( Yt- Y¯)1T2∑Tt = 1( Xt- X¯)2∑Tt = 1( Yt- Y¯)2---------------------------√
tiene sentido, ya que podemos tener una esperanza razonable de que la correlación de la muestra estimará . Resulta que esta esperanza no es infundada, ya que para procesos estacionarios que satisfacen ciertas condiciones tenemos que , como en probabilidad. Además, en distribución, por lo que podemos probar las hipótesis sobre .
ρ = c o r r ( Xt, Yt)ρ^→ ρT→ ∞ρT--√( ρ^- ρ ) → N( 0 , σ2ρ)ρ
Ahora suponga que no es estacionario. Entonces puede depender de . Entonces, cuando observamos una muestra de tamaño , potencialmente necesitamos estimar diferentes correlaciones . Por supuesto, esto no es factible, por lo que, en el mejor de los casos, solo podemos estimar algunas funciones de como la media o la varianza. Pero el resultado puede no tener una interpretación sensata. c o r r ( X t , Y t ) t T T ρ t ρ tZtc o r r ( Xt, Yt)tTTρtρt
Ahora examinemos qué sucede con la correlación de la caminata aleatoria del proceso no estacionario probablemente más estudiada. Llamamos al proceso una caminata aleatoria si , donde es un proceso estacionario. Por simplicidad, suponga que . LuegoZ t = ∑Zt= ( Xt, Yt)Ct=(Ut,Vt)ECt=0Zt= ∑ts = 1( Ut, Vt)dot= ( Ut, Vt)midot= 0
c o r r ( XtYt) = EXtYtD XtD Yt-------√= E∑ts = 1Ut∑ts = 1VtD ∑ts = 1UtD ∑ts = 1Vt----------------√
Para simplificar aún más las cosas, suponga que es un ruido blanco. Esto significa que todas las correlaciones son cero para . Tenga en cuenta que esto no restringe a cero.E ( C t C t + h ) h > 0 c o r r ( U t , V t )dot= ( Ut, Vt)mi(CtCt+h)h>0corr(Ut,Vt)
Entonces
corr(Xt,Yt)=tEUtVtt2DUtDVt−−−−−−−−√=corr(U0,V0).
Hasta ahora todo bien, aunque el proceso no es estacionario, la correlación tiene sentido, aunque tuvimos que hacer los mismos supuestos restrictivos.
Ahora, para ver qué sucede con la correlación de muestra, necesitaremos usar el siguiente hecho sobre caminatas aleatorias, llamado teorema del límite central funcional:
s∈[0,1]
1T−−√Z[Ts]=1T−−√∑t=1[Ts]Ct→(cov(C0))−1/2Ws,
en distribución, donde y es bivariante
Movimiento browniano (proceso de Wiener bidimensional). Por conveniencia, introduzca la definición .
s ∈ [ 0 , 1 ]M s = ( M 1 s , M 2 s ) = (Ws= ( W1 s, W2 s)METROs= ( M1 s, M2 s) = ( c o v ( C0 0) )- 1 / 2Ws
Nuevamente, por simplicidad, definamos la correlación de muestra como
ρ^= 1T∑Tt = 1XtYt1T∑Tt = 1X2t1T∑Tt = 1Y2t------------------√
Comencemos con las variaciones. Tenemos
mi1T∑t = 1TX2t= 1Tmi∑t = 1T( ∑s = 1tUt)2= 1T∑t = 1Tt σ2U= σUT+ 12.
Esto va al infinito a medida que aumenta, por lo que llegamos al primer problema, la varianza de la muestra no converge. Por otro lado, el teorema de mapeo continuo junto con el teorema funcional del límite central nos daT
T→∞
1T2∑t = 1TX2t= ∑t = 1T1T( 1T--√∑s = 1tUt)2→ ∫10 0METRO21 sres
donde la convergencia es convergencia en la distribución, como .
T→ ∞
Del mismo modo obtenemos
1
1T2∑t = 1TY2t→ ∫10 0METRO22 sres
y
1T2∑t = 1TXtYt→ ∫10 0METRO1 sMETRO2 sres
Finalmente, para la correlación muestral de nuestra caminata aleatoria, obtenemos
T→∞
ρ^→ ∫10 0METRO1 sMETRO2 sres∫10 0METRO21 sres ∫10 0METRO22 sres---------------√
en distribución como .
T→ ∞
Entonces, aunque la correlación está bien definida, la correlación de la muestra no converge hacia ella, como en el caso del proceso estacionario. En cambio, converge a una determinada variable aleatoria.