Mientras aprendía a calcular las matrices de covarianza y correlación y sus inversas en VB y T-SQL hace unos años, aprendí que las diversas entradas tienen propiedades interesantes que pueden hacerlas útiles en los escenarios correctos de minería de datos. Un ejemplo obvio es la presencia de variaciones en las diagonales de las matrices de covarianza; Algunos ejemplos menos obvios que todavía tengo que usar, pero que podrían ser útiles en algún momento, son los factores de inflación de varianza en las matrices de correlación inversa y las correlaciones parciales en las matrices de covarianza inversa.
Sin embargo, una cosa que todavía tengo que ver directamente abordada en la literatura es cómo interpretar los determinantes de estas matrices. Como los determinantes se calculan con frecuencia para otros tipos de matrices, esperaba encontrar una gran cantidad de información sobre ellos, pero he aparecido muy poco en búsquedas casuales tanto en los foros de StackExchange como en el resto de Internet. La mayoría de las menciones que he encontrado giran en torno al uso de los determinantes como un solo paso en el proceso de cálculo de otras pruebas y algoritmos estadísticos, como el Análisis de componentes principales (PCA) y una de las pruebas de Hotelling; ninguno aborda directamente cómo interpretar estos determinantes, por sí solos. ¿Hay alguna razón práctica por la que no se discuten a menudo en la literatura sobre minería de datos? Más importante, ¿Proporcionan alguna información útil de manera independiente? De ser así, ¿cómo podría interpretar los determinantes de cada uno? Me doy cuenta de que los determinantes son un tipo de volumen con signo inducido por una transformación lineal, por lo que sospecho que los determinantes de estos determinantes particulares podrían significar algún tipo de medida volumétrica de covarianza o correlación, etc. sobre un conjunto completo, o algo por el estilo ( a diferencia de la covarianza y correlación ordinarias, que se encuentran entre dos atributos o variables). Eso también plantea la pregunta de qué tipo de volumen representarían sus inversas. No estoy lo suficientemente familiarizado con el tema o la matemática de matriz pesada involucrada para especular más, pero soy capaz de codificar los cuatro tipos de matrices y sus determinantes. Mi pregunta no es apremiante pero a la larga tendré que tomar decisiones sobre si vale la pena incluir regularmente estas matrices y sus determinantes en mis procesos exploratorios de minería de datos. Es más barato calcular la covarianza y la correlación de manera individual y bivariada en estos idiomas en particular, pero haré un esfuerzo adicional e implementaré cálculos determinantes si puedo obtener algunas ideas más profundas que justifiquen el gasto en términos de recursos de programación Gracias por adelantado. Haré un esfuerzo adicional e implementaré cálculos determinantes si puedo obtener algunas ideas más profundas que justifiquen el gasto en términos de recursos de programación. Gracias por adelantado. Haré un esfuerzo adicional e implementaré cálculos determinantes si puedo obtener algunas ideas más profundas que justifiquen el gasto en términos de recursos de programación. Gracias por adelantado.