¿Existe una "regresión no supervisada"?


Respuestas:


20

Nunca me he encontrado con este término antes. No estoy seguro de si difundiría la luz o la oscuridad dentro de cualquiera de los ámbitos de las estadísticas: aquellos que son aprendizaje automático (donde las distinciones supervisadas y no supervisadas son centrales para la resolución de problemas) y las estadísticas inferenciales (donde la regresión, el análisis confirmatorio y los NHST se emplean con mayor frecuencia).

Cuando esas dos filosofías se superponen, la mayoría de la regresión y la terminología asociada se produce en un entorno estrictamente supervisado. Sin embargo, creo que muchos conceptos existentes en el aprendizaje no supervisado están estrechamente relacionados con los enfoques basados ​​en la regresión, especialmente cuando itera ingenuamente sobre cada clase o característica como un resultado y combina los resultados. Un ejemplo de esto es la PCA y el análisis de correlación bivariada. Al aplicar la mejor regresión de subconjuntos de forma iterativa sobre una serie de variables, puede hacer un tipo muy complejo de estimación de red, como se supone en el modelado de ecuaciones estructurales (estrictamente en el sentido de EPT). Esto, para mí, parece un problema de aprendizaje no supervisado con regresión.

YXXY


44
+1, y voto la oscuridad. Una búsqueda en Google arroja una serie de referencias a la "regresión no supervisada", muchas de las cuales son del modelo de ecuaciones estructurales / sabor de clases latentes. A partir de una breve revisión de estos documentos, personalmente trataría de describirlos como la aplicación de métodos de mínimos cuadrados (LS) y maximización de expectativas (EM) a problemas no supervisados, en lugar de "regresión no supervisada"
JBK

¡Gracias! Me pregunto si los problemas de aprendizaje sin supervisión tienen conmutatividad.
StackExchange for All

La mayoría de las aplicaciones de aprendizaje no supervisadas que he encontrado tratan con la estimación de covarianza y la agrupación (altamente relacionada). Debido a que en estas aplicaciones puede permutar arbitrariamente columnas de datos sin causar ninguna molestia, y no es necesario designar variables como características o respuestas, diría que estas aplicaciones son conmutativas.
AdamO

4

Lo más parecido que se me ocurre es una pequeña magia negra que despertó a la gente cuando se anunció hace unos años, pero no creo que haya ganado ninguna fuerza real en la comunidad. Los autores desarrollaron una estadística que llamaron el "Coeficiente de información máximo (MIC)". La idea general detrás de su método es tomar datos altamente dimensionales, trazar cada variable en comparación con cualquier otra variable en pares, y luego aplicar un interesante algoritmo de agrupamiento de ventanas a cada gráfico (que calcula el MIC para esas dos variables) para determinar si hay potencialmente una relación entre las dos variables. Se supone que la técnica es robusta para identificar relaciones estructuradas arbitrariamente , no solo lineales.

La técnica apunta a pares de variables, pero estoy seguro de que podría extenderse para investigar relaciones multivariadas. El problema principal sería que tendría que ejecutar la técnica en significativamente más combinaciones de variables, ya que permite la permutaciones de más y más variables. Me imagino que probablemente tome algo de tiempo solo con pares: intentar usar esto incluso en datos dimensionales remotamente altos y considerar relaciones más complejas que pares de variables se volvería intratable rápidamente.

Consulte el artículo Detección de asociaciones novedosas en grandes conjuntos de datos (2011)


0

La regresión automática es una forma de calcular los pesos de una matriz minimizando el error en la entrada reconstruida a partir de la entrada dada.


0

Esta pregunta vino a mi mente mientras investigaba la diferencia entre los métodos supervisados ​​y no supervisados. Viniendo de un contexto econométrico, prefiero pensar en modelos, lo que ralentizó mi comprensión ya que la mayoría de la literatura de aprendizaje automático que encontré se centra en los métodos.

Lo que he encontrado hasta ahora es que se debe hacer una distinción estricta entre clustering(sin supervisión) versus classification(supervisada). La analogía continua de la relación entre estos diseños de modelo sería principal component analysis(sin supervisión) versus linear regression(supervisada).

Sin embargo, diría que la relación entre la agrupación y la clasificación es pura coincidencia; existe solo cuando interpretamos que ambos diseños de modelos describen una relación geométrica, lo que considero innecesariamente restrictivo. Todos los métodos no supervisados ​​que conozco (k-means, algoritmos de mapas elásticos como kohonen / gas neuronal, DBSCAN, PCA) también pueden interpretarse como modelos de variables latentes. En el caso de los métodos de agrupación, esto equivaldría a ver pertenecer a un grupo como en un estado, que puede codificarse como un modelo de variable latente mediante la introducción de variables de estado.

Dada la interpretación como modelos de variables latentes, puede especificar cualquier modelo, posiblemente no lineal, que describa sus características en términos de variables latentes continuas.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.