Estoy estudiando el uso de las pruebas de significación estadística (SST) para validar los resultados del análisis de conglomerados. He encontrado varios artículos sobre este tema, como
- " Importancia estadística de la agrupación para datos de alta dimensión y bajo tamaño de muestra " por Liu, Yufeng et al. (2008)
- " En algunas pruebas de significación en el análisis de conglomerados ", por Bock (1985)
Pero estoy interesado en encontrar algo de literatura argumentando que SST es NO apropiado para validar los resultados del análisis de conglomerados. La única fuente que he encontrado afirmando esto es una página web de un proveedor de software
Para aclarar:
Estoy interesado en probar si se ha encontrado una estructura de conglomerados significativa como resultado del análisis de conglomerados, por lo tanto, me gustaría saber si hay documentos que respalden o rechacen la preocupación "sobre la posibilidad de pruebas post-hoc de los resultados de los datos exploratorios". análisis utilizado para encontrar grupos ".
Acabo de encontrar un artículo de 2003, " Métodos de agrupamiento y clasificación " de Milligan y Hirtle que dice, por ejemplo, que usar ANOVA sería un análisis no válido ya que los datos no tienen asignaciones aleatorias a los grupos.