¿Cómo calcula la distancia de Gower la diferencia entre las variables binarias?


13

Tengo 17 variables numéricas y 5 binarias (0-1), con 73 muestras en mi conjunto de datos. Necesito ejecutar un análisis de clúster. Sé que la distancia de Gower es una buena métrica para conjuntos de datos con variables mixtas. Sin embargo, no podía entender cómo la distancia de Gower calcula la diferencia entre las variables binarias . Me parece que no es diferente de la distancia euclidiana.


Tu pregunta no está del todo clara. ¿Simplemente pregunta 'cómo calcula la distancia de Gower la diferencia entre las variables binarias'? ¿Qué significa "no hay diferencia que Euclidiana" significa?
gung - Restablece a Monica

1
Gracias. Lo siento, pregunto cómo Gower calcula la diferencia entre las variables binarias. Quiero decir, no pude entender las diferencias por cierto. Euclidiana y Gower para variable binaria.
Emrah Bilgiç

¿Has buscado en este sitio Gower? stats.stackexchange.com/a/15313/3277
ttnphns

Sí, lo hice. La distancia euclidiana es 0, si ambas muestras tienen el mismo valor, 1 si no. ¿Qué hay de Gower?
Emrah Bilgiç

44
@ EmrahBilgiç, la métrica de Gower es similitud, no distancia. Se convierte en "distancia" cuando se resta de 1. Lea en el enlace de arriba cómo procesa los datos binarios.
ttnphns

Respuestas:


5

¿Qué hay de los atributos binarios que tienen los valores "m" y "f" para "masculino" y "femenino"?

¿Te das cuenta de que para una variable dicotómica, todo lo que puedes obtener es "igual" o "diferente"? La diferencia de puntos clave entre distancias no es si el valor es 1 o 0; pero cómo se combinan múltiples variables.


3

La distancia de Gower usa Manhattan para calcular la distancia entre puntos de datos continuos y Dice para calcular la distancia entre puntos de datos categóricos

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.