Preguntas etiquetadas con data-mining

Una actividad que busca patrones en conjuntos de datos grandes y complejos. Por lo general, enfatiza las técnicas algorítmicas, pero también puede involucrar cualquier conjunto de habilidades, aplicaciones o metodologías relacionadas con ese objetivo.

1
Agrupación de datos de clientes almacenados en ElasticSearch
Tengo un montón de perfiles de clientes almacenados en un clúster de Elasticsearch . Estos perfiles ahora se utilizan para la creación de grupos objetivo para nuestras suscripciones de correo electrónico. Los grupos objetivo ahora se forman manualmente usando las capacidades de búsqueda facetada de búsqueda elástica (como obtener todos …

4
¿Cómo depurar el análisis de datos?
Me he encontrado con el siguiente problema, que reconozco es bastante típico. Tengo algunos datos grandes, por ejemplo, unos pocos millones de filas. Ejecuto algunos análisis no triviales, por ejemplo, una consulta SQL que consta de varias subconsultas. Obtengo algún resultado, indicando, por ejemplo, que la propiedad X aumenta con …

3
Relación entre convolución en matemáticas y CNN
He leído la explicación de la convolución y la entiendo hasta cierto punto. ¿Alguien puede ayudarme a entender cómo esta operación se relaciona con la convolución en redes neuronales convolucionales? ¿Es el filtro como una función gque aplica peso?
10 machine-learning  neural-network  deep-learning  cnn  convolution  machine-learning  ensemble-modeling  machine-learning  classification  data-mining  clustering  machine-learning  feature-selection  convnet  pandas  graphs  ipython  machine-learning  apache-spark  multiclass-classification  naive-bayes-classifier  multilabel-classification  machine-learning  data-mining  dataset  data-cleaning  data  machine-learning  data-mining  statistics  correlation  machine-learning  data-mining  dataset  data-cleaning  data  beginner  career  python  r  visualization  machine-learning  data-mining  nlp  stanford-nlp  dataset  linear-regression  time-series  correlation  anomaly-detection  ensemble-modeling  data-mining  machine-learning  python  data-mining  recommender-system  machine-learning  cross-validation  model-selection  scoring  prediction  sequential-pattern-mining  categorical-data  python  tensorflow  image-recognition  statistics  machine-learning  data-mining  predictive-modeling  data-cleaning  preprocessing  classification  deep-learning  tensorflow  machine-learning  algorithms  data  keras  categorical-data  reference-request  loss-function  classification  logistic-regression  apache-spark  prediction  naive-bayes-classifier  beginner  nlp  word2vec  vector-space-models  scikit-learn  decision-trees  data  programming 

3

2
¿Cuándo elegir regresión lineal o árbol de decisión o regresión de bosque aleatorio? [cerrado]
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 4 años . Estoy trabajando en un proyecto y tengo dificultades para decidir qué algoritmo …
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 

3
Datos comerciales de NASDAQ
Estoy tratando de encontrar datos de stock para practicar, ¿hay un buen recurso para esto? Encontré esto: ftp://emi.nasdaq.com/ITCH/ pero solo tiene el año actual. Ya tengo una forma de analizar el protocolo, pero me gustaría tener más datos para comparar. No tiene que estar en el mismo formato, siempre que …




1
Minería de datos relacionales sin ILP
Tengo un gran conjunto de datos de una base de datos relacional para la que necesito crear un modelo de clasificación. Normalmente para esta situación, usaría Programación Lógica Inductiva (ILP), pero debido a circunstancias especiales no puedo hacer eso. La otra forma de abordar esto sería tratar de agregar los …



5
Agrupamiento con coseno similitud
Tengo un gran conjunto de datos y una similitud de coseno entre ellos. Me gustaría agruparlos usando la similitud de coseno que reúne objetos similares sin necesidad de especificar de antemano el número de grupos que espero. Leí la documentación de sklearn de DBSCAN y Affinity Propagation, donde ambos requieren …


2
¿Cómo construir un motor de búsqueda textual?
Tengo una cadena HTML y quiero saber si una palabra que proporciono es relevante en esa cadena. La relevancia podría medirse según la frecuencia en el texto. Un ejemplo para ilustrar mi problema: this is an awesome bike store bikes can be purchased online. the bikes we own rock. check …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.