Preguntas etiquetadas con large-data

Los 'datos grandes' se refieren a situaciones en las que el número de observaciones (puntos de datos) es tan grande que necesita cambios en la forma en que el analista de datos piensa o realiza el análisis. (No debe confundirse con 'alta dimensionalidad').




7
Retos de la industria contra Kaggle. ¿Es más importante recopilar más observaciones y tener acceso a más variables que el modelado elegante?
Espero que el título se explique por sí mismo. En Kaggle, la mayoría de los ganadores usan el apilamiento con a veces cientos de modelos base, para exprimir un porcentaje adicional de MSE, precisión ... En general, según su experiencia, cuán importante es el modelado sofisticado, como el apilamiento frente …



10
¿Qué es exactamente Big Data?
En varias ocasiones me han hecho la pregunta: ¿Qué es Big-Data? Tanto por los estudiantes como por mis familiares que están recogiendo el rumor sobre las estadísticas y el aprendizaje automático. Encontré esta publicación de CV . Y siento que estoy de acuerdo con la única respuesta allí. La página …
44 large-data 






1
Aprendizaje de última generación en streaming
Últimamente he estado trabajando con grandes conjuntos de datos y encontré muchos documentos sobre métodos de transmisión. Para nombrar unos pocos: Follow-the-Regularized-Leader and Mirror Descent: Equivalence Theorems and L1 Regularization ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) Aprendizaje continuo: SVM de un solo paso ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) Pegasos: Primal Estimado sub-GrAdient SOlver para SVM …


3
Primer paso para big data ( , )
Suponga que está analizando un gran conjunto de datos con miles de millones de observaciones por día, donde cada observación tiene un par de miles de variables numéricas y categoriales dispersas y posiblemente redundantes. Digamos que hay un problema de regresión, un problema de clasificación binaria desequilibrada y una tarea …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.