Paquetes de selección de características en R, que hacen tanto la regresión como la clasificación


12

Soy muy nuevo en R. Estoy aprendiendo machine learning en este momento. Lo siento mucho, si esta pregunta parece ser muy básica. Estoy tratando de encontrar un buen paquete de selección de características en R. Revisé el paquete Boruta. Es un buen paquete, pero leí que solo es útil para la clasificación.

Quiero implementar la selección de características en R para tareas de regresión. Revisé la documentación del paquete caret, pero para mi nivel, es muy difícil de entender.

¿Alguien puede señalarme un buen tutorial o enumerar los paquetes buenos o los paquetes más utilizados en R para la selección de funciones?

Cualquier ayuda sería apreciada. Gracias por adelantado.


3
Boruta funciona bien para la regresión.

Respuestas:


13

También puede echar un vistazo a FSelector , varSelRF . FSelector contiene múltiples funciones para la selección de características basadas, por ejemplo, en la prueba de chi cuadrado, en la teoría de la información (entropía, información mutua, relación de ganancia, ...), en la correlación entre característica, consistencia, etc. varSelRF es un paquete útil para la selección de características utilizando bosques aleatorios con eliminación de variables hacia atrás y con espectro de importancia.


2
Hola FWaldner, esto parece un poco corto para una respuesta. ¿Podría considerar expandirlo tal vez por una o dos oraciones, tal vez para mencionar brevemente lo que hacen estos paquetes que es similar o diferente a las otras sugerencias, o incluso tal vez en contra de otras cosas? Tal como está, básicamente es solo un par de enlaces.
Glen_b -Reinstale a Monica

Parece que varSelRF también está dirigido únicamente a la clasificación de bosques aleatorios en lugar de la regresión.
blmoore

7

¿Has mirado en el aprendizaje automático y estadístico de aprendizaje CRAN vista de tareas donde aparte símbolo de intercalación y Boruta bastante se mencionan algunos otros paquetes?

En general, si no comprende un procedimiento estadístico específico con respecto a la selección de funciones, podría ser mejor que haga una pregunta específica al respecto. El siguiente enlace de CV puede resultar bastante útil como un comienzo: Algoritmos para la selección automática de modelos .


3

Sugiero Rattle que tiene una selección aleatoria de características forestales (y mucho más). Tiene una GUI agradable y muy fácil de usar.



1

Además, el Caretpaquete también proporciona métodos de selección de funciones. Aquí y aquí hay un par de tutoriales sobre el uso de la selección de funciones en Caret package. Recientemente, un paquete de selección de características basado en el algoritmo SISAL de Tikka y Hollmén está disponible en el CRAN .


El enlace al tutorial está muerto. Sin embargo, este enlace podría ser útil.
Ekaba Bisong el
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.