Tengo un viejo conjunto de datos vectoriales con polígonos que cubren un continente. Los datos se publicaron por primera vez en papel a escala 1: 5 000 000 y luego se digitalizaron. No tengo los datos originales y no tengo información sobre la vectorización o metadatos. Supongo que la distancia entre los vértices en lugar de la precisión limita la resolución.
Los vértices se guardan con alta resolución (por ejemplo, "nnn.nnnnnnnnn", "- nn.nnnnnnnnn"). El conjunto de datos tiene pocos puntos que se pueden georreferenciar ni ningún nodo que se defina como coordenadas (por ejemplo, en grados pares o coordenadas UTM). Cuando comparo algunas secciones de la costa, el error es de hasta +/- 20 km.
Me gustaría encontrar una fórmula para estimar el error máximo basado en la distribución de los vértices. Tengo acceso a cualquier aplicación SIG, pero preferiría una referencia estadística sólida.
¿Cómo puedo calcular el error máximo del conjunto de datos, suponiendo que todos los vértices son correctos? O redactado de manera diferente: ¿Qué método puedo usar para encontrar la resolución más grande del conjunto de datos?
Traté de rasterizar el conjunto de datos en diferentes tamaños de celda y luego sobremuestrearlo a un tamaño de celda pequeño para detectar la rasterización más pequeña posible sin pérdida de resolución, pero eso es un enfoque bastante lento y no muy matemático.