Interpretación de los valores propios de la arpillera inversa en un rastreador KLT


12

Soy un estudiante de maestría, preparando un seminario en visión artificial. Entre los temas se encuentra el rastreador Kanade-Lucas-Tomasi (KLT), como se describe en

J. Shi, C. Tomasi, "Buenas características para rastrear" . Actas CVPR '94.

Aquí hay un recurso web que estoy usando para comprender el rastreador KLT. Necesito ayuda con las matemáticas, ya que estoy un poco oxidado en álgebra lineal y no tengo experiencia previa con visión por computadora.

En esta fórmula para (paso 5 en el resumen), observe la arpillera inversa:Δp

Δp=H1Σx[IWp]T[T(x)I(W(x;p))]

En el artículo, las buenas características para rastrear se definen como aquellas en las que la suma de las matrices de Hesse inversas tienen valores propios grandes y similares: . No pude entender cómo y de dónde se deriva esto, matemáticamente.min(λ1,λ2)>threshold

La intuición es que esto representa un rincón; T entiendo eso. ¿Qué tiene que ver eso con los valores propios? Espero que si los valores del Hessian son bajos, no hay cambio, y no es una esquina. Si son altos, es una esquina. ¿Alguien sabe cómo la intuición de la esquina entra en juego en los valores propios de la arpillera inversa para determinar Δp través de las iteraciones del rastreador KLT?

He podido encontrar recursos que afirman que la arpillera inversa se correlaciona con la matriz de covarianza de la imagen. Además, la covarianza de la imagen indica el cambio de intensidad, y entonces tiene sentido ... pero no he podido encontrar qué es exactamente una matriz de covarianza de imagen con respecto a una imagen, y no a un vector o una colección de imágenes.

Además, los valores propios tienen significado en el análisis de componentes principales, por lo que tengo la idea de una matriz de covarianza de imagen, pero no estoy seguro de cómo aplicar esto al hessiano, ya que generalmente se aplica a una imagen. El Hessian, hasta donde yo entiendo, es una matriz que define las segundas derivadas para , , y en una determinada ubicación .2×2xyxy(x,y)

Realmente agradecería ayuda con esto, ya que he estado en esto por más de 3 días, es solo una pequeña fórmula y el tiempo se acaba.


ok, lo he conseguido a través de un montón de recursos web sobre curvatura principal, geomatría diferencial, número de condición de matriz (matriz bien condicionada). Todavía necesito formular una explicación razonable para el seminario. Una vez que lo tenga, lo publicaré aquí o vincularé esta página al seminario.

Respuestas:


5

Piense en ellos como términos de suavidad 2D.
Cuanto más suave sea el parche, menor será el rango de la matriz y más cerca estará la matriz de ser singular.

En un borde recto (no en una esquina), solo un valor propio será grande.
En una esquina ambos serán grandes.

El uso de valores propios significa que el ángulo del borde no es un factor, y en cualquier ángulo, un borde dará solo un gran ev


Gracias por su respuesta. He encontrado muchos recursos dando intuiciones similares y discutiendo el problema de apertura. La intuición es y fue clara. mi pregunta era de naturaleza más matemática, y una vez que encontré la respuesta resultó que era mucho más simple. solo propiedades básicas de la matriz. valores propios similares significan que la matriz está bien condicionada, y el valor propio máximo está limitado, por lo que dar un límite inferior hace que los valores propios sean similares. más aún, los valores propios se correlacionan con las curvaturas principales, para el hessian. Esta es la información que estaba buscando en ese momento.

vuelvo a leer su respuesta, y encuentro el comentario sobre los valores propios y el ángulo perspicaz. gracias por compartir eso conmigo

Debe marcarlo como "Respondido" entonces.
Adi Shavit el
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.