He estado buscando algoritmos de detección de marcadores para usar con una aplicación basada en Kinect, y la mayoría del trabajo que he podido encontrar obviamente se centra en la detección de características en imágenes 'normales'.
Sin embargo, el hardware de Kinect proporciona (esencialmente, una vez que ha ajustado) un valor de profundidad de 11 bits por píxel.
Esta imagen de profundidad también tiene varios artefactos visuales en ella desde las sombras proyectadas alrededor de los bordes de los objetos (ver, por ejemplo, el fuerte borde negro en este video http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).
Si bien algunas técnicas tradicionales de visión artificial (p. Ej., Detección de bordes) funcionan bien con esto, otras no, y parece que hay poca información en la red que lo discuta.
Como un simple ejemplo, el uso del valor de profundidad hace que sea trivial detectar la orientación de un bloque marcador una vez que lo haya localizado.
Entonces, ¿alguien ha visto discusiones / documentos / etc. que cubran el procesamiento de una imagen de profundidad para la detección de características?
¿Alguien puede recomendar un buen algoritmo para detectar marcadores de "profundidad" (efectivamente bloques de origami en lugar de marcadores en blanco y negro impresos)?
Lo que he hecho hasta ahora ha sido la experimentación ad hoc usando opencv para procesar las imágenes, pero eso no es lo suficientemente estable o rápido.
Si se vincula a un producto comercial de visión artificial sin algún tipo de prueba, mencione en su respuesta por qué cree que es apropiado.