Un nombre: primero, posiblemente un segundo nombre y apellido.
Tengo curiosidad acerca de cuánta información puede extraer de un nombre, utilizando conjuntos de datos disponibles públicamente. Sé que puede obtener lo siguiente en cualquier lugar entre una probabilidad baja-alta (dependiendo de la entrada) utilizando los datos del censo de EE. UU .: 1) Género. 2) raza.
Facebook, por ejemplo, usó exactamente eso para descubrir, con un nivel de precisión decente, la distribución racial de los usuarios de su sitio (https://www.facebook.com/note.php?note_id=205925658858).
¿Qué más se puede extraer? No busco nada específico, esta es una pregunta muy abierta para calmar mi curiosidad.
Mis ejemplos son específicos de los EE. UU., Por lo que asumiremos que el nombre es el nombre de alguien ubicado en los EE. UU. pero, si alguien conoce los conjuntos de datos disponibles públicamente para otros países, estoy más que abierto a ellos también.
No estoy muy seguro de si este es el lugar correcto para esto, si no es así, agradecería que alguien me pudiera señalar un lugar más apropiado.
Espero que esta sea una pregunta interesante, ¡y este es el lugar apropiado!