Estadísticas y Big Data feature-construction

2

Wikipedia proporciona el siguiente ejemplo al describir el hashing de características ; pero el mapeo no parece consistente con el diccionario definido Por ejemplo, todebe convertirse de 3acuerdo con el diccionario, pero está codificado como en su 1lugar. ¿Hay algún error en la descripción? ¿Cómo funciona el hashing de funciones? …

10 feature-construction

1

Manejo de conjuntos de datos de series temporales muy grandes

Tengo acceso a un conjunto de datos muy grande. Los datos provienen de grabaciones MEG de personas que escuchan extractos musicales, de uno de los cuatro géneros. Los datos son los siguientes: 6 sujetos 3 repeticiones experimentales (épocas) 120 ensayos por época 8 segundos de datos por prueba a 500Hz …

10 machine-learning feature-selection large-data feature-construction

1

¿Por qué las características aleatorias de Fourier no son negativas?

Las características aleatorias de Fourier proporcionan aproximaciones a las funciones del núcleo. Se utilizan para varios métodos de kernel, como SVM y procesos gaussianos. Hoy, intenté usar la implementación de TensorFlow y obtuve valores negativos para la mitad de mis funciones. Según tengo entendido, esto no debería suceder. Así que …

10 machine-learning kernel-smoothing feature-construction tensorflow fourier-transform

3

Algoritmo de aprendizaje automático para clasificar

Tengo un conjunto de elementos que puedo describir de acuerdo con n características. Así:XXXnortenn Xyo: { cyo 1, cyo 2, ... , cyo n} ∣ xyo∈ Xxi:{ci1,ci2,…,cin}∣xi∈Xx_i: \{c_{i1}, c_{i2}, \ldots, c_{in}\} \mid x_i \in X donde es la evaluación (numérica) para el elemento acuerdo con las características . Por lo …

10 machine-learning algorithms ranking feature-construction

6

Cómo preparar / construir características para la detección de anomalías (datos de seguridad de red)

Mi objetivo es analizar los registros de red (p. Ej., Apache, syslog, auditoría de seguridad de Active Directory, etc.) utilizando la detección de agrupamiento / anomalías para fines de detección de intrusos. De los registros tengo muchos campos de texto como dirección IP, nombre de usuario, nombre de host, puerto …

9 feature-selection outliers unsupervised-learning feature-construction

2

¿Qué tan importante es la expansión de bases para redes profundas?

Si se considera que las redes neuronales profundas son aproximadores de función universal, ¿es realmente necesaria la expansión de la base? ¿O esto sería específico para cada caso? Por ejemplo, si uno tiene tres variables X cuantitativas, ¿habría alguna ventaja en expandir el número de variables mediante la introducción de …

8 neural-networks deep-learning feature-construction

2

Característica extraída por agrupación máxima frente a agrupación media

En el aprendizaje profundo, y su aplicación a la visión por computadora, ¿es posible decir qué tipo de características extraen estos dos tipos de agrupación? por ejemplo, ¿es posible decir que max pool extrae bordes? ¿Podemos decir algo similar con respecto a la agrupación media? PS no dude en recomendar …

8 machine-learning deep-learning feature-construction computer-vision

1

Codificación de características categóricas de alta cardinalidad (muchas categorías) cuando las características difieren mucho de la cardinalidad

He estado buscando preguntas sobre la codificación de características categóricas, pero no pude encontrar ninguna que discuta mi problema. Disculpas si me lo perdí. Digamos que tenemos un conjunto de datos con variables binarias y nominales de aproximadamente igual importancia cada una. La mayoría de los clasificadores no pueden ocuparse …

8 classification categorical-data dimensionality-reduction feature-construction many-categories

2

¿Por qué un modelo estadístico se sobreajusta si se le da un gran conjunto de datos?

Mi proyecto actual puede requerir que construya un modelo para predecir el comportamiento de un determinado grupo de personas. el conjunto de datos de entrenamiento contiene solo 6 variables (la identificación es solo para fines de identificación): id, age, income, gender, job category, monthly spend en el cual monthly spendestá …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

3

Característica de construcción en R

Me pregunto si hay algún algoritmo (quizás algoritmos genéticos) en R para la construcción de características (derivar predictores candidatos de predictores existentes). Estoy pensando en una rutina para probar potencias de orden superior, interacciones, relaciones y combinaciones lineales y funciones no lineales de variables existentes (sin, cos, atan, etc.). Esto …

8 r machine-learning feature-construction genetic-algorithms

Preguntas etiquetadas con feature-construction