Preguntas etiquetadas con data-mining

La minería de datos utiliza métodos de inteligencia artificial en un contexto de base de datos para descubrir patrones previamente desconocidos. Como tal, los métodos generalmente no están supervisados. Está estrechamente relacionado pero no es idéntico al aprendizaje automático. Las tareas clave de la minería de datos son el análisis de conglomerados, la detección de valores atípicos y la extracción de reglas de asociación.

4
¿Cómo comenzar a leer sobre minería de datos?
Soy un novato que comenzará a leer sobre minería de datos. Tengo conocimientos básicos de IA y estadísticas. Dado que muchos dicen que el aprendizaje automático también juega un papel importante en la minería de datos, ¿es necesario leer sobre el aprendizaje automático antes de poder continuar con la minería …


2
¿Cuáles son las aplicaciones prácticas existentes y conocidas de la teoría del caos en la minería de datos?
Mientras leía casualmente algunos trabajos de mercado masivo sobre la teoría del caos en los últimos años, comencé a preguntarme cómo se podrían aplicar varios aspectos de la minería de datos y campos relacionados, como redes neuronales, reconocimiento de patrones, gestión de incertidumbre, etc. Hasta la fecha, yo Me he …

3
¿El bosque aleatorio y el refuerzo son paramétricos o no paramétricos?
Al leer el excelente modelo estadístico: Las dos culturas (Breiman 2001) , podemos aprovechar toda la diferencia entre los modelos estadísticos tradicionales (p. Ej., Regresión lineal) y los algoritmos de aprendizaje automático (p. Ej., Ensacado, bosque aleatorio, árboles potenciados ...). Breiman critica los modelos de datos (paramétricos) porque se basan …




3
¿Necesito descartar variables que estén correlacionadas / colineales antes de ejecutar kmeans?
Estoy ejecutando kmeans para identificar grupos de clientes. Tengo aproximadamente 100 variables para identificar grupos. Cada una de estas variables representa el% de gasto de un cliente en una categoría. Entonces, si tengo 100 categorías, tengo estas 100 variables, de modo que la suma de estas variables es del 100% …

4
Las mejores formas de agregar y analizar datos
Recientemente comencé a enseñarme a mí mismo el Aprendizaje automático y el Análisis de datos. Me encuentro con un obstáculo en la necesidad de crear y consultar grandes conjuntos de datos. Me gustaría tomar datos que he estado agregando en mi vida profesional y personal y analizarlos, pero no estoy …

3
La idea de hacer que los datos tengan una media cero
A menudo veo personas que hacen que una dimensión / característica de un conjunto de datos sea de media cero al eliminar la media de todos los elementos. ¿Pero nunca entendí por qué hacerlo? ¿Cuál es el efecto de hacer eso como un paso de preprocesamiento? ¿Mejora el rendimiento de …



1



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.