Estamos creando un sitio web que recopilará información de ubicación (puntos) de los usuarios. Estamos explorando técnicas para preservar la privacidad de la ubicación de los usuarios (por ejemplo, a menudo los usuarios compartirán su dirección particular, que es confidencial). Una opción que se me ocurrió es ofuscar o "trocear" los puntos antes de almacenarlos en la base de datos, eliminando la necesidad de almacenar estos datos confidenciales.
Nuestros requisitos básicos son, creo:
Dado un único punto ofuscado, no es posible derivar el punto original dentro de (digamos) un kilómetro más o menos, incluso dados todos los metadatos asociados con el punto (es decir, suponga que toda la base de datos está comprometida).
Dado un conjunto arbitrariamente grande de puntos ofuscados que corresponden al mismo punto original, todavía no es posible derivar el punto original. (Por ejemplo, una técnica fácil sería agregar un vector aleatorio al punto original, pero si lo hace suficientes veces, los puntos ofuscados se agruparán alrededor del punto original).
Sería bueno si se preservaran varias propiedades estadísticas, aunque no sé qué propiedades son importantes en esta etapa. Por ejemplo, prefiero que los puntos ofuscados se dispersen de forma "natural" en lugar de acumularse en una cuadrícula. Sin embargo, la privacidad es más importante que esto.