La mejor manera de agrupar una matriz de adyacencia

9

He tenido dificultades para interpretar los grupos resultantes de una matriz de adyacencia. Tengo 200 matrices relativamente grandes que representan sujetos que contienen correlaciones parciales (puntajes z) de series de tiempo (datos neuronales). El objetivo es agrupar esas 210 matrices y detectar cualquier comunidad potencial no descubierta. Entonces hice otros cálculos de correlación parcial que resultaron en una matriz de adyacencia de 200x200. Cada vez que ejecuto un algoritmo de detección de comunidad (por ejemplo, el de Newmann) aparece con comunidades difícilmente interpretables.

La pregunta es qué tipo de pruebas estadísticas dirán si estas comunidades o grupos son significativos en absoluto. y si es así, ¿hay formas sistemáticas de resolver la interpretación?

clustering neuroimaging

— Fahd
fuente

Hasta donde sé, no hay una única "forma correcta" de hacer esto. Un enfoque sería usar algo como agrupamiento jerárquico en la matriz de distanciadonde es las correlaciones. La otra cosa es si su última matriz de correlación capturará relaciones significativas. ¿Qué pasos se tomaron para producirlo?

1 - | ρ |

$1 - |\rho|$

ρ

$\rho$

— conjeturas

Gracias. Con respecto a su pregunta, lo que hice fue correlacionar cada fila (o datos del sujeto) con cualquier otro sujeto usando corrcoef (correlación simple) y así es como obtuve los resultados. Estoy tratando de detectar los patrones y es por eso que tuve que correlacionar nuevamente.

— Fahd

en el OP, se sugiere que los datos de los sujetos estén valorados en matriz, entonces, ¿cómo se convierte esto en una sola fila por sujeto?

— conjeturas

2

He realizado algunos trabajos en el pasado sobre el agrupamiento espectral que podría ser útil aquí. La idea básica es que uno puede usar la matriz de adyacencia para formar la llamada matriz laplaciana:

$L = I-D^{-1/2}AD^{-1/2}$

Puedes comprobar por ti mismo que el valor propio más bajo del Laplaciano es cero. El primer valor propio distinto de cero a menudo se llama conectividad algebraica, y el vector generador correspondiente tendrá una parte positiva y una parte negativa correspondiente a dos particiones del gráfico subyacente. En términos generales, la magnitud del primer valor propio distinto de cero es una medida de la fuerza de las conexiones entre las dos particiones. Tal vez podría emplear este enfoque de forma recursiva o considerar los primeros valores de signo distintos de cero del Laplaciano. El siguiente artículo de Wikipedia sobre la agrupación espectral es un buen comienzo. $(B_1,B_2)$

— Abbas
fuente

2

Estoy viendo el mismo problema en este momento. Según una revisión rápida, parece que la agrupación espectral es la forma más "natural" de analizar una matriz de adyacencia. Vea esta publicación de blog para más detalles.

— Hanan Shteingart
fuente

0

Alternativamente ... Los datos neuronales (reales o artificiales) a menudo son una representación de datos altamente comprimida, lo que significa que los datos son muy aleatorios, lo que significa que no encontrará ninguna correlación. ¡¡El que tienes!! ¡Felicidades! :)

— Rayo
fuente