¿Qué tan viable sería clasificar la textura de una imagen usando características de una transformada discreta de coseno? Buscar en Google "clasificación de textura dct" solo encuentra un artículo académico sobre este tema, utilizando una red neuronal.
Para mi aplicación, tengo un gran corpus de imágenes etiquetadas, en el que toda la imagen tiene una textura consistente (por ejemplo, primeros planos de una manta, corteza de árbol, un campo de hierba, etc.).
Inspirado por una respuesta a una pregunta anterior , estaba considerando el siguiente enfoque:
- divide cada imagen en bloques de píxeles NxN
- tomar el DCT de cada bloque
- aplanar cada DCT en una matriz 1xM y alimentarlo a un algoritmo de agrupación K-Means, y obtener la etiqueta de agrupación para cada DCT
- calcule un histograma de etiquetas de agrupamiento para cada imagen contando cada etiqueta por imagen del # 3
- entrenar un clasificador SVM al alimentarlo con un conjunto de [(histograma, etiqueta de imagen)]
¿Qué tan bien funcionaría esto? Implementé un sistema similar, usando características extraídas a través de los algoritmos SIFT / SURF, pero solo pude obtener un 60% de precisión.
¿De qué otras maneras podría usar el DCT para clasificar texturas?