Podrías usar un método como eigenfaces, http://en.wikipedia.org/wiki/Eigenface . A continuación se detalla el procedimiento, así como enlaces a diferentes implementaciones.
http://www.pages.drexel.edu/~sis26/Eigenface%20Tutorial.htm
A partir de aquí, es común usar esto en un enfoque de clasificación, entrenar un modelo y luego predecir casos. Puede hacer esto entrenando a un grupo de celebridades conocidas y si predice una cara de Twitter como una en su modelo entrenado de celebridades, elimínela. Similar a este http://blog.cordiner.net/2010/12/02/eigenfaces-face-recognition-matlab/
Esto sufre constantes enmiendas. Pronto habrá un nuevo Justin Bieber que no estará en su modelo entrenado, por lo que no puede predecirlo. También hay un caso como Whitney Houston, puede que nunca hayas pensado en agregarla antes, pero puede ser una imagen común por respeto y admiración durante unas semanas. Sin embargo, no tendrá la desventaja de las fotos de bebés como se mencionó anteriormente. Para superar estos problemas, podría utilizar más un enfoque de agrupamiento jerárquico. Al eliminar los primeros conjuntos de grupos que están muy cerca si alcanzan un cierto nivel de soporte, su primer grupo tiene 15 elementos antes de construir un segundo. Ahora no tiene que preocuparse por quién está en su modelo de entrenamiento, pero caerá en el tema de las fotos del bebé.