Calcular el mejor subconjunto de predictores para regresión lineal


9

Para la selección de predictores en regresión lineal multivariada con predictores adecuados, ¿qué métodos están disponibles para encontrar un subconjunto 'óptimo' de los predictores sin probar explícitamente todos los subconjuntos de ? En 'Análisis de supervivencia aplicada', Hosmer y Lemeshow hacen referencia al método de Kuk, pero no puedo encontrar el documento original. ¿Alguien puede describir este método o, mejor aún, una técnica más moderna? Uno puede asumir errores distribuidos normalmente.2 pp2p


1
¿Te refieres al siguiente documento? Kuk, AYC (1984) Todos los subconjuntos de regresión en un modelo de riesgos proporcionales. Biometrika, 71, 587-592
chl

si de hecho. Supongo que tendré que desenterrar ese papel de alguna manera. Parece viejo, sin embargo.
shabbychef

2
Mientras tanto, encuentre este artículo, El método de lazo para la selección de variables en el modelo cox, de Tibshirani (Stat. Med. 1997 16: 385-395), j.mp/bw0mB9 . HTH
chl

1
y este más reciente (estrechamente relacionado con el penalizedpaquete R), j.mp/cooIT3 . Quizás este también, j.mp/bkDQUj . Saludos
chl

Respuestas:


12

Nunca he oído hablar del método de Kuk, pero el tema candente en estos días es la minimización de L1. La razón es que si usa un término de penalización del valor absoluto de los coeficientes de regresión, los que no son importantes deberían ir a cero.

Estas técnicas tienen algunos nombres divertidos: Lasso, LARS, selector de Dantzig. Puede leer los documentos, pero un buen lugar para comenzar es con Elementos del aprendizaje estadístico , Capítulo 3.


2
Por cierto, el paquete R penalizado ( j.mp/bdQ0Rp ) incluye la estimación penalizada l1 / l2 para los modelos Lineal y Cox generalizados.
chl

atascado en la tierra matlab, implementandolo yo mismo ...
shabbychef

LARS es genial, por cierto. cosas muy chulas no estoy seguro de cómo puedo meterlo en el marco del modelo de riesgos proporcionales de Cox, aunque ...
shabbychef

2
El software Glmnet tiene un modelo Cox PH enlazado : cran.r-project.org/web/packages/glmnet/index.html también hay una versión de MATLAB (aunque no estoy seguro si tiene un modelo cox): www-stat .stanford.edu / ~ tibs / glmnet-matlab
Simon Byrne

3

Este es un gran tema. Como se mencionó anteriormente, Hastie, Tibshirani y Friedman dan una buena introducción en Ch3 de Elementos de aprendizaje estadístico.

Algunos puntos 1) ¿Qué quieres decir con "mejor" u "óptimo"? Lo que es mejor en un sentido puede no serlo en otro. Dos criterios comunes son la precisión predictiva (predicción de la variable de resultado) y la producción de estimadores imparciales de los coeficientes. Algunos métodos, como la regresión Lasso y Ridge, inevitablemente producen estimadores de coeficientes sesgados.

2) La frase "mejores subconjuntos" en sí misma puede usarse en dos sentidos separados. Generalmente para referirse al mejor subconjunto entre todos los predictores que optimiza algunos criterios de construcción de modelos. Más específicamente, puede referirse al algoritmo eficiente de Furnival y Wilson para encontrar ese subconjunto entre números moderados (~ 50) de predictores lineales (Regressions by Leaps and Bounds. Technometrics, Vol. 16, No. 4 (noviembre de 1974), págs. 499-51)

http://www.jstor.org/stable/1267601


1) sí, la pregunta es algo ambigua; Hay, como usted menciona, muchas definiciones de 'óptimo': a través del criterio de información, validación cruzada, etc. Sin embargo, Hosmer y Lemeshow hacen referencia a este método (una variante de trabajo de Lawless & Singhal), que de alguna manera 'mágicamente' selecciona predictores mediante un solo cálculo de un MLR (módulo algunas otras cosas). Tengo mucha curiosidad sobre este método ...
shabbychef

0

Lo que aprendí es que, en primer lugar, utiliza el Enfoque del mejor subconjunto como una herramienta de detección, luego los procedimientos de selección por pasos pueden ayudarlo a decidir finalmente qué modelos podrían ser los mejores modelos de subconjuntos (en este momento, el número de esos modelos es bastante pequeño para manejar). Si uno de los modelos cumple con las condiciones del modelo, hace un buen trabajo al resumir la tendencia en los datos y, lo más importante, le permite responder a su pregunta de investigación, entonces felicidades por su trabajo.


1
Creo que puedes estar recordando esto mal. Los mejores subconjuntos son mucho más caros desde el punto de vista computacional que paso a paso, pero necesariamente atraparían cualquier cosa paso a paso, por lo que usaría paso a paso para seleccionar los mejores subconjuntos. FWIW, no estoy de acuerdo con el uso ingenuo de estas estrategias, por las razones que discuto en mi respuesta aquí: algoritmos para la selección automática de modelos .
gung - Restablece a Monica
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.