Preguntas etiquetadas con feature-construction

La ingeniería de características es el proceso de usar el conocimiento del dominio de los datos para crear características para los modelos de aprendizaje automático. Esta etiqueta está destinada tanto a preguntas teóricas como prácticas sobre ingeniería de características, excluyendo las preguntas que solicitan código, que estarían fuera de tema en CrossValidated.

6
¿Forma de principios de colapsar variables categóricas con muchos niveles?
¿Qué técnicas están disponibles para contraer (o agrupar) muchas categorías a unas pocas, con el fin de usarlas como entrada (predictor) en un modelo estadístico? Considere una variable como estudiante universitario mayor (disciplina elegida por un estudiante universitario). Es desordenada y categórica, pero puede tener docenas de niveles distintos. Digamos …

2
Los codificadores automáticos no pueden aprender funciones significativas
Tengo 50,000 imágenes como estas dos: Representan gráficos de datos. Quería extraer características de estas imágenes, así que utilicé el código del codificador automático proporcionado por Theano (deeplearning.net). El problema es que estos autoencoders no parecen aprender ninguna característica. He intentado RBM y es lo mismo. El conjunto de datos …



2
¿Cuándo debemos discretizar / bin variables / características continuas independientes y cuándo no?
¿Cuándo debemos discretizar / bin variables / características independientes y cuándo no? Mis intentos de responder la pregunta: En general, no debemos bin, porque binning perderá información. El binning en realidad aumenta el grado de libertad del modelo, por lo que es posible causar un ajuste excesivo después del binning. …


2
Tutoriales para ingeniería de características
Como todos saben, la ingeniería de características es extremadamente importante para el aprendizaje automático, sin embargo, encontré pocos materiales asociados con esta área. Participé en varias competiciones en Kaggle y creo que las buenas características pueden ser incluso más importantes que un buen clasificador en algunos casos. ¿Alguien sabe algún …







1
Extracción automática de palabras clave: uso de similitudes de coseno como características
Tengo una matriz de términos de documentos , y ahora me gustaría extraer palabras clave para cada documento con un método de aprendizaje supervisado (SVM, Naive Bayes, ...). En este modelo, ya uso Tf-idf, etiqueta Pos, ...METROMETROM Pero ahora me pregunto sobre nexts. Tengo una matriz con las similitudes de …

2
¿Ingeniería de características agnósticas de dominio que conserva el significado semántico?
La ingeniería de características es a menudo un componente importante para el aprendizaje automático (se utilizó mucho para ganar la Copa KDD en 2010 ). Sin embargo, creo que la mayoría de las técnicas de ingeniería de características destruir cualquier significado intuitivo de las características subyacentes o son muy específicos …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.