Un problema en la visión por computadora y la reconstrucción en 3D es obtener los parámetros intrínsecos de la cámara. Una solución común es usar un objeto en el que uno conozca las medidas de la forma de antemano, como un tablero de damas. El problema con este método es que debe hacerse cada vez que cambie el parámetro de la cámara, como la distancia focal y la ampliación.
Estoy tratando de implementar la autocalibración de la cámara discutida en Una técnica simple para la autocalibración . La matriz esencial está limitada por sus dos valores singulares. Esto se puede utilizar para recuperar los elementos intrínsecos de la cámara sin realizar una calibración manual (es decir, con un tablero de ajedrez). Estoy un poco confundido acerca de cómo se puede minimizar la función de costo. Esto es lo que entiendo hasta ahora:
matriz esencial
matriz intrínseca
- producto de longitud focal y factor de aumento [resolver]
- relación de aspecto [supongo que siempre, supongo que de la cámara o datos EXIF?]
- son las coordenadas del punto principal [suponga 0, 0]
- sesgada [asumir 0]
función de costo los s son los valores singulares de
Pregunta: ¿Cómo se minimiza esta función de costo?