Estoy tratando de encontrar algún método para detectar personas usando solo una cámara a 3 metros del suelo. Este es un cuadro devuelto por la cámara:
ACTUALIZACIÓN: Prueba de video -> http://dl.dropbox.com/u/5576334/top_head_shadow.avi
Para hacer eso, primero entiendo que tengo que realizar una segmentación de fondo y primer plano. Esa es la parte fácil.
Con la máscara de primer plano, puedo realizar operaciones simples como Hough transform para encontrar círculos, pero de esta manera solo se detecta el 60% de las cabezas, incluidos muchos falsos positivos.
Podría usar algunas otras técnicas simples como la segmentación del color, pero descubrí que las cabezas de las personas son muy diferentes desde arriba debido a su peinado, color, cantidad de cabello, ...
Otra opción que tengo al respecto es la posibilidad de utilizar descriptores HOG, o características similares a Haar, pero necesitaría una extensa base de datos de personas vistas desde arriba para entrenar a los modelos. No he encontrado nada de eso.
Pensé que este sería un problema muy recurrente, pero no puedo encontrar mucho al respecto en la literatura o en Internet. Cualquier ayuda para resolver esta tarea será apreciada :-)
ACTUALIZACIÓN: para obtener más información, el objetivo es implementar algún método genérico para realizar el seguimiento del flujo de peatones. El primer prototipo será probado en un centro comercial.