Preguntas etiquetadas con data-mining

La minería de datos utiliza métodos de inteligencia artificial en un contexto de base de datos para descubrir patrones previamente desconocidos. Como tal, los métodos generalmente no están supervisados. Está estrechamente relacionado pero no es idéntico al aprendizaje automático. Las tareas clave de la minería de datos son el análisis de conglomerados, la detección de valores atípicos y la extracción de reglas de asociación.


8
Realice clusters de K-means (o sus parientes cercanos) con solo una matriz de distancia, no datos de puntos por características
Quiero realizar la agrupación K-means en los objetos que tengo, pero los objetos no se describen como puntos en el espacio, es decir, por objects x featuresconjunto de datos. Sin embargo, puedo calcular la distancia entre dos objetos (se basa en una función de similitud). Entonces, dispongo de la matriz …


3
Primer paso para big data ( , )
Suponga que está analizando un gran conjunto de datos con miles de millones de observaciones por día, donde cada observación tiene un par de miles de variables numéricas y categoriales dispersas y posiblemente redundantes. Digamos que hay un problema de regresión, un problema de clasificación binaria desequilibrada y una tarea …






2
Función de "interés" para preguntas de StackExchange
Esta pregunta se migró de Mathematics Stack Exchange porque se puede responder en Cross Validated. Migrado hace 8 años . Estoy tratando de armar un paquete de minería de datos para los sitios de StackExchange y, en particular, estoy estancado en tratar de determinar las preguntas "más interesantes". Me gustaría …

1
Supervisión distante: supervisada, semi-supervisada, o ambas?
La "supervisión distante" es un esquema de aprendizaje en el que se aprende un clasificador dado un conjunto de entrenamiento débilmente etiquetado (los datos de entrenamiento se etiquetan automáticamente según la heurística / reglas). Creo que tanto el aprendizaje supervisado como el aprendizaje semi-supervisado pueden incluir tal "supervisión distante" si …


3
¿Cuál es la diferencia práctica entre las reglas de asociación y los árboles de decisión en la minería de datos?
¿Existe una descripción realmente simple de las diferencias prácticas entre estas dos técnicas? Ambos parecen ser utilizados para el aprendizaje supervisado (aunque las reglas de asociación también pueden manejar sin supervisión). Ambos se pueden usar para la predicción Lo más parecido que he encontrado a una "buena" descripción es del …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.