Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo








2
¿Cómo se aplica SMOTE en la clasificación de texto?
La técnica de sobremuestreo de minorías sintéticas (SMOTE) es una técnica de sobremuestreo utilizada en un problema de conjunto de datos desequilibrado. Hasta ahora tengo una idea de cómo aplicarlo en datos genéricos y estructurados. ¿Pero es posible aplicarlo en un problema de clasificación de texto? ¿Qué parte de los …

4
¿Una alternativa de codificación activa para grandes valores categóricos?
Hola, tengo un marco de datos con grandes valores categóricos en más de 1600 categorías. ¿Hay alguna forma de encontrar alternativas para no tener más de 1600 columnas? Encontré esto debajo del enlace interesante http://amunategui.github.io/feature-hashing/#sourcecode Pero se están convirtiendo a clase / objeto que no quiero. ¿Quiero mi salida final …



4
Dimensionalidad y múltiple
Una oración comúnmente escuchada en el aprendizaje automático sin supervisión es Las entradas de alta dimensión generalmente viven en o cerca de un múltiple de baja dimensión ¿Qué es una dimensión? ¿Qué es un múltiple? ¿Cuál es la diferencia? ¿Puedes dar un ejemplo para describir ambos? Colector de Wikipedia: En …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.