Actualmente estoy trabajando en CBIR usando componentes de árboles , lo que debería ser una idea relativamente nueva. Algunas ventajas esperadas del uso de árboles de componentes para describir imágenes serían:
- La representación del árbol de componentes de una imagen no dependería tanto de las deformaciones (incluso proyectivas) de la imagen.
- Examinar diferentes niveles del árbol permitiría comparaciones y operaciones hasta un nivel diferente de detalle.
- La discriminación y la descripción deberían funcionar mejor que las técnicas actuales en imágenes de baja textura.
Como recién comencé con la investigación relacionada con este tema, tengo una idea vaga de mis objetivos: representar la imagen con el Árbol de componentes y luego comparar dichos Árboles de componentes, ya sea directamente o encontrando una representación vectorizada. Probablemente podré decir mucho más en unas pocas semanas (o meses), pero por ahora solo puedo ofrecer la lista de documentos que me recomendaron como introducción a los árboles de componentes (todavía no los he leído):
Tal vez pueda actualizar la respuesta como y si encuentro algo relevante.
Además, si su objetivo es, en cierto modo, unir con mayor precisión las regiones de la imagen en lugar de solo puntos , porque las regiones podrían ser más discriminatorias, hubo una sugerencia agradable en J. Sivic y A. Zisserman: "Video Google: A Text Retrieval Enfoque de coincidencia de objetos en videos " .
Me refiero a la sección que trata sobre la Consistencia espacial , donde un grupo de coincidencias entre puntos de características se acepta solo si los puntos de características mantienen una configuración espacial similar en ambas imágenes. Por lo tanto, la coincidencia no solo depende del tipo de característica extraída (DoG, MSER, ...) o del descriptor (SIFT), sino que también examina el entorno más amplio de un punto de característica, haciéndolo (al menos un poco) dependiente de la región.