Estoy trabajando en algún software que debería determinar ubicaciones del mundo real (por ejemplo, cámaras de velocidad) a partir de varios informes basados en GPS . Un usuario conducirá al informar una ubicación, por lo tanto, los informes son muy inexactos. Para resolver ese problema, tengo que agrupar los informes sobre la misma ubicación y calcular un promedio.
Mi pregunta es sobre cómo agrupar esos informes . He leído acerca de los algoritmos Expectativa-maximación y k-means clustering , pero como ya he entendido que tendría que determinar el número de localizaciones reales de antemano.
¿Existen otros algoritmos que no necesiten el número exacto de ubicaciones reales, sino que usen algunas condiciones de borde (por ejemplo, distancia mínima)?
Un informe contiene longitud , latitud y precisión (en metros). No hay nombre ni nada que pueda usarse para identificar duplicados.
Otro obstáculo podría ser que será común, que solo hay un informe para una ubicación en el mundo real. Eso hace que sea difícil distinguir los valores atípicos de los buenos datos.