Respuestas:
Ninguna de las herramientas listas para usar en ArcGIS (o cualquier otro SIG, AFAIK) hará el trabajo correctamente.
En un problema como este, debe cuantificar lo que quiere decir con "agrupamiento" y luego debe plantear un modelo de probabilidad para evaluar si el grado medido de agrupamiento podría haberse producido por casualidad.
Como ejemplo de cómo proceder, puede optar por medir la agrupación en términos de distancias típicas entre edificios de tipo x y el edificio más cercano de tipo y . Este es un cálculo fácil: simplemente represente ambos conjuntos de edificios mediante capas de puntos separadas y realice una unión espacial de las Y a las X. La tabla de atributos, que todavía tiene un registro para cada edificio tipo x , ahora incluirá la distancia a la y más cercana . Puede usar la distancia promedio como su medida.
Probar si esto podría ser el resultado del azar es más complicado. Una interpretación plausible de esta configuración es que la presencia anterior de edificios de tipo y fomentó el desarrollo de edificios de tipo x relativamente cerca de los y 's. De lo contrario, podríamos plantear la hipótesis de que los edificios de tipo x podrían haberse construido en cualquier lugar donde también aparecieron otros edificios. Esto lleva a la siguiente prueba de permutación simple . Cree una capa de puntos de todas las ubicaciones posibles donde podrían haber aparecido edificios tipo x . Esta capa podría ser la ubicación de todos los edificios en el área erigida durante el mismo período que la xedificios fueron (incluidos los x edificios en sí, por supuesto). Une espacialmente la capa y para obtener las distancias al edificio tipo y más cercano . El resto del cálculo funciona fuera de la tabla de atributos: se realizan los cálculos geográficos. Lo que hará es usar repetidamente un generador de números aleatorios para tomar una muestra aleatoria simple de todos estos edificios, cada muestra tiene exactamente la misma cantidad de elementos que los edificios de tipo x . Calcule la distancia promedio para esta muestra. Repita hasta que tenga muchas estadísticas de distancia promedio. Si casi todas estas distancias promedio obtenidas al azar son mayores que la distancia promedio que midió para la xtipo de edificios, puede concluir que las x no están agrupadas por casualidad: el efecto es real.
(Dichos cálculos se programan mejor en una plataforma adecuada para tales fines, como 'R', pero casi cualquier software de computación puede ser puesto en servicio, incluso Excel. La programación es muy, requiere poco más que saber cómo escribir bucles y seleccionar elementos de matrices al azar).
Este enfoque de prueba de permutación es superior a las soluciones preprogramadas porque explica explícitamente los patrones de desarrollo de edificios en esta área. Si no se hace esto, a menudo se encuentran evidencia "significativa" de la agrupación, pero no se puede concluir nada útil a partir de ella, debido a que la agrupación puede haber sido causado por otros factores tales como los patrones de carreteras, las ubicaciones de sitios adecuados para el desarrollo, y muchas otras cosas.
Por supuesto, su método de análisis de datos debe depender del problema sustantivo que motive el análisis.
Pero aquí hay algunas ideas:
Cómo funciona el Análisis de conglomerados espaciales de distancias múltiples: la función k de Ripley (Estadística espacial) , donde i y j en la ecuación denotarían sus edificios x e y. La función K de Ripley proporcionará inferencia probabilística.
Existen algoritmos complejos para el descubrimiento de patrones de uso compartido que puede buscar en Google.
Yo mismo nunca he realizado análisis de conglomerados en SIG, pero sería más fácil si creara puntos / polígonos para representar un conglomerado dado de X y / o Y. Por ejemplo, si creó puntos para significar la construcción de Y, entonces podría use la herramienta Distancia de puntos para obtener todos los puntos del edificio X dentro de una distancia dada de sus ubicaciones de origen.
De lo contrario, crear un búfer alrededor de edificios de tipo Y y seleccionar todos los edificios de tipo X logrará el mismo resultado si no tiene ArcInfo.
Puede combinar ambas capas agregando una columna binaria (0,1) para identificar si el edificio es de X o Y.
A partir de ahí, utilizando GeoDa , podría identificar la autocorrelación espacial local (agrupación) y determinar si era alta-baja (una capa agrupada alrededor de la otra capa) baja-alta (la inversa) o alta-alta o baja-baja (auto- agrupamiento). Guía del usuario aquí (.pdf)