Preguntas etiquetadas con bigdata

Big data es el término para una colección de conjuntos de datos tan grandes y complejos que resulta difícil procesarlos utilizando herramientas de administración de bases de datos disponibles o aplicaciones de procesamiento de datos tradicionales. Los desafíos incluyen captura, curación, almacenamiento, búsqueda, intercambio, transferencia, análisis y visualización.



1
Evite recargar DataFrame entre diferentes núcleos de Python
¿Hay alguna manera de mantener una variable (cuadro grande / marco de datos) en la memoria y compartirla en múltiples computadoras portátiles ipython? Estaría buscando algo, que es conceptualmente similar a las variables persistentes de MATLAB. Allí es posible llamar a una función / biblioteca personalizada desde múltiples editores individuales …

3

2
¿Cuándo elegir regresión lineal o árbol de decisión o regresión de bosque aleatorio? [cerrado]
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 4 años . Estoy trabajando en un proyecto y tengo dificultades para decidir qué algoritmo …
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 


1
Diferencia entre interpolar () y fillna () en pandas
Dado que el método interpolar y llenar hace el mismo trabajo de llenar valores n. ¿Cuál es la diferencia básica entre los dos? ¿Cuál es el significado de tener estos dos métodos diferentes? ¿Alguien puede explicarme en términos simples? Ya visité la documentación oficial y quería saber la diferencia.



1
Error en cascada en la tormenta de Apache
Revisando la presentación y el material de Summingbird por Twitter, una de las razones que se mencionan para usar los clústeres de Storm y Hadoop juntos en Summingbird es que el procesamiento a través de Storm produce una cascada de errores. Para evitar esta cascada de errores y su acumulación, …
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.