Resumen de mi respuesta. Me gusta el modelado en cadena de Markov, pero pierde el aspecto "temporal". En el otro extremo, enfocarse en el aspecto temporal (por ejemplo, tiempo promedio enes un intermedio del caso cuando solo se estima la probabilidad de transición y el caso cuando solo se mide el tiempo pasado en un estado dado. Espero que esto ayude.−1
(VDi)i≥1(Si)i≥1
Yt=Y+t−Y−t
Y+t=∑i=0∞1VDi≤t,Si=1 and Y−t=∑i=0∞1VDi≤t,Si=−1
ϵ
λϵt=limdt→01dtP(Yϵt+dt−Yϵt=1|Ft)
ϵ−+FtFt=σ(Y+t,Y−t,VD1,…,VDY+t+Y−t,S1,…,SY+t+Y−t)
pero en la línea de su pregunta, creo que asume implícitamente que
Esto significa que para existe una secuencia determinista tal que .
P(Yϵt+dt−Yϵt=1|Ft)=P(Yϵt+dt−Yϵt=1|Yt)
ϵ=+,−(μϵi)i∈Zλϵt=μϵYt
Dentro de este formalismo, su pregunta puede reformularse como: "es probable que " (o al menos la diferencia sea mayor que un umbral dado).μ+−1−μ+0>0
Bajo este supuesto, es fácil demostrar que es un [proceso de Markov homogéneo] [3] en con el generador dado porYtZQ
∀i,j∈ZQi,i+1=μ+iQi,i−1=μ−iQii=1−(μ+i+μ−i)Qij=0 if |i−j|>1
Respondiendo la pregunta (proponiendo una estimación de máxima verosimilitud para el problema estadístico)
A partir de esta reformulación, la solución del problema se realiza estimando y construyendo una prueba sobre sus valores. Arreglemos y olvidemos el índice sin pérdida de generalidad. La estimación de (y ) se puede hacer sobre la observación de(μ+i)iμ+μ−
(T1,η1),…,(Tp,ηp) donde son las longitudes de de los períodos pasados en el estado (es decir, tiempos sucesivos con ) y es si la pregunta se votó a favor, si se votó a favor y si fue el último estado de observación.TjjthpiYt=iηj+1−10
Si olvida el caso con el último estado de observación, las parejas mencionadas son iid de una distribución que depende de y : se distribuye como (donde Exp es una var aleatoria de una distribución exponencial y es + o -1 dependiendo de quién se da cuenta del máximo). Luego, puede usar el siguiente lema simple (la prueba es sencilla):μ+iμ−i(min(Exp(μ+i),Exp(μ−i)),η)η
Lema Si y entonces, y . X+⇝Exp(μ+)X−⇝Exp(μ−)T=min(X+,X−)⇝Exp(μ++μ−)P(X+1<X−)=μ+μ++μ−
Esto implica que la densidad de viene dada por:
donde para es la función de densidad de una variable aleatoria exponencial con el parámetro . De esta expresión, es fácil derivar el estimador de máxima verosimilitud de y :f(t,ϵ)(T,η)
f(t,ϵ)=gμ++μ−(1(ϵ=+1)∗μ++1(ϵ=−1)∗μ−μ++μ−)
gaa>0aμ+μ−
(μ^+,μ^−)=argminln(μ−+μ+)((μ−+μ+)∑i=1pTi+p)−p−ln(μ−)−p+ln(μ+)
dondey.
p−=|i:δi=−1|p+=|i:δi=+1|
Comentarios para enfoques más avanzados
Si desea tener en cuenta los casos en que es el último estado observado (ciertamente más inteligente porque cuando pasa por , a menudo es su último puntaje ...), debe modificar un poco el razonamiento. La censura correspondiente es relativamente clásica ...i−1
Otro posible acercamiento puede incluir la posibilidad de
- Tener una intensidad que disminuye con el tiempo.
- Tener una intensidad que disminuye con el tiempo transcurrido desde la última votación (prefiero este. En este caso, hay una forma clásica de modelar cómo disminuye la densidad ...
- Es posible que desee asumir que es una función fluida deμ+ii
- .... puedes proponer otras ideas!