Es importante entender que el único problema aquí es obtener los parámetros extrínsecos. La intrínseca de la cámara se puede medir fuera de línea y hay muchas aplicaciones para ese propósito.
¿Qué son las cámaras intrínsecas?
Parámetros intrínsecos de la cámara por lo general se llama la matriz de calibración de la cámara, K . Podemos escribir
K= ⎡⎣⎢αtu0 00 0sαv0 0tu0 0v0 01⎤⎦⎥
dónde
y α v son el factor de escala en lasdirecciones de coordenadas u y v , y son proporcionales a la distancia focal f de la cámara: α u = k u f y α v = k v f . k u y k v son el número de píxeles por unidad de distancia en lasdirecciones u y v .αtuαvtuvFαtu= ktuFαv= kvFktukvtuv
se llama el punto principal, generalmente las coordenadas del centro de la imagen.c = [ u0 0, v0 0]T
es la inclinación, solo que no es cero si u y v no son perpendiculares.stuv
Una cámara se calibra cuando se conocen intrínsecos. Esto se puede hacer fácilmente para que no se considere un objetivo en la visión por computadora, sino un paso trivial fuera de línea.
¿Qué son las cámaras extrínsecas?
Cámara extrínseca o parámetros externos es una matriz de 3 × 4 que corresponde a la transformación euclidiana de un sistema de coordenadas mundiales al sistema de coordenadas de la cámara. R representa una matriz de rotación 3 × 3 y t una traslación.[ R | t ]3 × 4R3 × 3t
Las aplicaciones de visión por computadora se centran en estimar esta matriz.
[ R | t ] = ⎡⎣⎢R11R21R31R12R22R32R13R23R33TXTyTz⎤⎦⎥
¿Cómo calculo la homografía a partir de un marcador plano?
La homografía es una matriz homogénea que relaciona un plano 3D y su proyección de imagen. Si tenemos un plano Z = 0, la homografía H que mapea un punto M = ( X , Y , 0 ) T en este plano y su correspondiente punto 2D m debajo de la proyección P = K [ R | t ] es3 × 3Z= 0HMETRO= ( X, Y, 0 )TmetroPAGS= K[ R | t ]
metro~= K[ R1R2R3t] ⎡⎣⎢⎢⎢XY0 01⎤⎦⎥⎥⎥
= K[ R1R2t] ⎡⎣⎢XY1⎤⎦⎥
H= K[ R1R2t]
Para calcular la homografía necesitamos pares de puntos mundo-cámara. Si tenemos un marcador plano, podemos procesar una imagen del mismo para extraer características y luego detectar esas características en la escena para obtener coincidencias.
Solo necesitamos 4 pares para calcular la homografía usando Transformación lineal directa.
Si tengo homografía, ¿cómo puedo obtener la pose de la cámara?
La homografía y la cámara plantean K [ R | t ] contienen la misma información y es fácil pasar de una a otra. La última columna de ambos es el vector de traducción. La columna uno H 1 y dos H 2 de homografía también son la columna uno R 1 y dos R 2 de la matriz de pose de cámara. Solo queda la columna tres R 3 de [ R | t ] , y como tiene que ser ortogonal, se puede calcular como el producto cruzado de las columnas uno y dos:HK[ R | t ]H1H2R1R2R3[ R | t ]
R3= R1⊗ R2
[ R | t ]