¿Qué es la distancia de Mahalanobis y cómo se usa en el reconocimiento de patrones?


11

¿Alguien puede explicarme el concepto de distancia de Mahalanobis? Por ejemplo, ¿cuál es la distancia de Mahalanobis entre dos puntos x e y, y especialmente, cómo se interpreta para el reconocimiento de patrones?


3
¿Qué entiendes ahora, algo? ¿Has probado Wikipedia?
gung - Restablece a Monica


Puedes usar este enlace. describe bien people.revoledu.com/kardi/tutorial/Similarity/…
Zohreh

Respuestas:


13

La distancia de Mahalanobis proporciona una manera de medir cuán similar es un conjunto de condiciones a un conjunto conocido de condiciones. Cuenta la covarianza entre variables.

Se calcula como: donde: D 2

D2=(xm)TC1(xm)
D2=Mahalanobis distancex=Vector of datam=Vector of mean values of independent variablesC1=Inverse Covariance matrix of independent variablesT=Indicates vector should be transposed

Esta página proporciona una explicación detallada (con ejemplos del análisis del paisaje).


1
gracias, la fuente me dio una buena explicación para empezar
ayariga

5

La distancia de Mahalanobis se utiliza para encontrar valores atípicos en un conjunto de datos. No sé en qué campo se encuentra, pero en psicología se usa para identificar casos que no "encajan" con lo que se espera dadas las normas para el conjunto de datos. Por ejemplo, si su muestra está compuesta por individuos con bajos niveles de depresión y tiene uno o dos individuos con niveles muy altos de depresión, entonces tendrían distancias de Mahalanobis que son mayores que el valor crítico esperado. Probablemente desee eliminar estos casos si son muy extremos Y si considera que no encajan con su conjunto de datos. (Usando el ejemplo proporcionado, su muestra está compuesta por individuos con bajos niveles de depresión, por lo tanto, aquellos uno o dos individuos con altos niveles de depresión no encajan con el resto). La identificación de valores atípicos es muy importante porque muchos análisis estadísticos tienen un "supuesto de normalidad", es decir, una expectativa de que sus datos se distribuyen normalmente. Los valores atípicos también pueden contribuir a datos sesgados, y por esta razón también deberían eliminarse. (A menos que transforme toda la variable y esto corrija la inclinación). Muchos programas de estadísticas como SPSS le permiten calcular las distancias M y la probabilidad asociada con cada puntaje para identificar valores atípicos. Puedo proporcionarle instrucciones de SPSS, pero no sé si está utilizando SPSS. (A menos que transforme toda la variable y esto corrija la inclinación). Muchos programas de estadísticas como SPSS le permiten calcular las distancias M y la probabilidad asociada con cada puntaje para identificar valores atípicos. Puedo proporcionarle instrucciones de SPSS, pero no sé si está utilizando SPSS. (A menos que transforme toda la variable y esto corrija la inclinación). Muchos programas de estadísticas como SPSS le permiten calcular las distancias M y la probabilidad asociada con cada puntaje para identificar valores atípicos. Puedo proporcionarle instrucciones de SPSS, pero no sé si está utilizando SPSS.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.