Preguntas etiquetadas con normalization

Por lo general, "normalización" significa volver a expresar los datos para hacer que los valores se encuentren dentro de un rango especificado.

6
¿Cómo normalizar los datos al rango 0-1?
Estoy perdido en la normalización, ¿podría alguien guiarme por favor? Tengo valores mínimos y máximos, digamos -23.89 y 7.54990767, respectivamente. Si obtengo un valor de 5.6878, ¿cómo puedo escalar este valor en una escala de 0 a 1?



9
¿Cómo y por qué funcionan la normalización y el escalado de características?
Veo que muchos algoritmos de aprendizaje automático funcionan mejor con la cancelación media y la ecualización de covarianza. Por ejemplo, las redes neuronales tienden a converger más rápido, y K-Means generalmente ofrece una mejor agrupación con características preprocesadas. No veo que la intuición detrás de estos pasos de preprocesamiento conduzca …

3
¿Realizar la normalización de características antes o dentro de la validación del modelo?
Una buena práctica común en Machine Learning es hacer la normalización de características o la estandarización de datos de las variables predictoras, eso es todo, centrar los datos restando la media y normalizarlos dividiendo por la varianza (o la desviación estándar también). Para la autocontención y, a mi entender, hacemos …

1
¿Cómo aplicar la estandarización / normalización al entrenamiento y al conjunto de pruebas si el objetivo es la predicción?
¿Transforme todos mis datos o pliegues (si se aplica CV) al mismo tiempo? p.ej (allData - mean(allData)) / sd(allData) ¿Transforme el conjunto de trenes y el conjunto de pruebas por separado? p.ej (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) ¿O transformo el conjunto de trenes y uso …







2
¿La similitud del coseno es idéntica a la distancia euclidiana normalizada l2?
Idéntico significado, que producirá resultados idénticos para una clasificación entre un vector de similitud u y un conjunto de vectores V . Tengo un modelo de espacio vectorial que tiene la medida de distancia (distancia euclidiana, similitud de coseno) y la técnica de normalización (ninguno, l1, l2) como parámetros. Según …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.