Es incorrecto que HMC no sea un método de la cadena de Markov. Por Wikipedia :
En matemáticas y física, el algoritmo híbrido de Monte Carlo, también conocido como Hamiltoniano Monte Carlo, es un método de Monte Carlo en cadena de Markov para obtener una secuencia de muestras aleatorias a partir de una distribución de probabilidad para la cual el muestreo directo es difícil. Esta secuencia se puede usar para aproximar la distribución (es decir, para generar un histograma) o para calcular una integral (como un valor esperado).
Para mayor claridad, lea el documento arXiv de Betancourt , que menciona los criterios de terminación NUTS:
... identifique cuándo una trayectoria es lo suficientemente larga como para producir una exploración suficiente del vecindario alrededor del nivel de energía actual establecido. En particular, queremos evitar tanto la integración demasiado corta, en cuyo caso no aprovecharíamos al máximo las trayectorias hamiltonianas, como la integración demasiado larga, en cuyo caso desperdiciamos valiosos recursos computacionales en la exploración que produce rendimientos decrecientes.
El Apéndice A.3 habla de algo así como la trayectoria que duplica que menciona:
También podemos expandirnos más rápido duplicando la longitud de la trayectoria en cada iteración, produciendo una trayectoria muestreada t ∼ T (t | z) = U T2L con el estado muestreado correspondiente z ′ ∼ T (z ′ | t). En este caso, los componentes de trayectoria antiguos y nuevos en cada iteración son equivalentes a las hojas de árboles binarios ordenados perfectos (Figura 37). Esto nos permite construir los nuevos componentes de trayectoria de forma recursiva, propagando una muestra en cada paso de la recursividad ...
y amplía esto en A.4, donde habla de una implementación dinámica (la sección A.3 habla de una implementación estática):
Afortunadamente, los esquemas estáticos eficientes discutidos en la Sección A.3 se pueden repetir para lograr una implementación dinámica una vez que hayamos elegido un criterio para determinar cuándo una trayectoria ha crecido lo suficiente como para explorar satisfactoriamente el conjunto de niveles de energía correspondiente.
Creo que la clave es que no hace saltos que doblan, calcula su próximo salto usando una técnica que duplica la longitud del salto propuesto hasta que se cumpla un criterio. Al menos así es como entiendo el artículo hasta ahora.