Preguntas etiquetadas con data-mining

La minería de datos utiliza métodos de inteligencia artificial en un contexto de base de datos para descubrir patrones previamente desconocidos. Como tal, los métodos generalmente no están supervisados. Está estrechamente relacionado pero no es idéntico al aprendizaje automático. Las tareas clave de la minería de datos son el análisis de conglomerados, la detección de valores atípicos y la extracción de reglas de asociación.

1
CARRITO: ¿Selección del mejor predictor para dividir cuando las ganancias en la disminución de impurezas son iguales?
Mi pregunta trata sobre los árboles de clasificación . Considere el siguiente ejemplo del conjunto de datos de Iris: Quiero seleccionar manualmente el mejor predictor para la primera división. Según el algoritmo CART, la mejor característica para hacer una división es la que maximiza la disminución de la impureza de …


3
Detectar grupos en una secuencia binaria
Tengo una secuencia binaria como 11111011011110101100000000000100101011011111101111100000000000011010100000010000000011101111 Donde los grupos de la mayoría de los 1 son seguidos por un mayor número de ceros, como en la imagen a continuación (el negro representa 1): Me gustaría aplicar una técnica (preferiblemente en R o en Python) donde pueda detectar automáticamente estos grupos …



5
Documentos de minería de datos / ejemplos
Estoy buscando algunos documentos / sitios web de tamaño medio a largo sobre la minería de datos, específicamente donde se explora en profundidad un conjunto de datos desde la preparación de datos hasta el modelo final. Estoy particularmente interesado en las discusiones sobre la aplicación de algos de aprendizaje automático …
8 r  data-mining 

1
¿Qué significa este desenfoque alrededor de la línea en este gráfico?
Estaba jugando con ggplot2 usando los siguientes comandos para ajustar una línea a mis datos: ggplot(data=datNorm, aes(x=Num, y=Val)) + geom_point() + stat_summary(fun.data = "mean_cl_boot", geom="errorbar", colour="red", width=0.8) + stat_sum_single(median) + stat_sum_single(mean, colour="blue") + geom_smooth(level = 0.95, aes(group=1), method="lm") Los puntos rojos son valores medios, el azul son las medias y …
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.