¡La técnica de "factorización matricial" NO lo ayudará a hacer su trabajo! El artículo referido por @ mirror2image trata sobre la sustracción del fondo pero NO está basado en la "factorización matricial".
El uso de videos en ejecución para detectar objetos en movimiento (ya sea humanos o vehículos) es un área activa de investigación.
Como principio básico, el sistema estima un fondo estático típico mediante el muestreo de múltiples imágenes y toma una diferencia de energía entre la imagen entrante y el fondo. Si la energía es significativa, el píxel se clasifica como primer plano. Tal conjunto de primer plano le indica si hay una entrada del objeto en el sistema.
La mejor referencia a su trabajo de investigación (y también relativamente más simple si realmente desea implementar) sería: W4 System lo encontrará aquí y vea el documento de Picardi aquí como una encuesta más detallada para otras técnicas en el sistema.
Hay muchos desafíos que se aplican al problema:
La presencia de ruido crea problemas de gran ambigüedad. El enfoque aquí es aplicar un filtro temporal eficiente y considerar la variación del ruido para hacerlo inmune al umbral.
La presencia de sombras crea la ambigüedad de no ser un primer plano ni ser un primer plano. Hay documentos que modelan la distinción entre color e intensidad para distinguir entre sombra y primer plano real.
El fondo puede ser complejo como agitar árboles o mar, etc.
El fondo puede tener una variación de iluminación lenta o repentina donde el fondo "aprendido" anterior se adapta al nuevo.
Uno de los documentos de referencia más conocidos se llama Algoritmo de flor de pared que muestra la mejor manera de combinar varios de estos escenarios para producir una detección robusta de objetos en movimiento.