Preguntas etiquetadas con statistics

La estadística es un enfoque científico para la inferencia inductiva y la predicción basada en modelos probabilísticos de los datos. Por extensión, cubre el diseño de experimentos y encuestas para recopilar datos para este propósito.

1
¿Cómo obtener la correlación entre dos variables categóricas y una variable categórica y una variable continua?
Estoy construyendo un modelo de regresión y necesito calcular lo siguiente para verificar las correlaciones Correlación entre 2 variables categóricas multinivel Correlación entre una variable categórica de niveles múltiples y una variable continua VIF (factor de inflación de varianza) para variables categóricas de niveles múltiples Creo que es incorrecto usar …

4
Redes neuronales: ¿qué función de costo usar?
Estoy usando TensorFlow para experimentos principalmente con redes neuronales. Aunque he realizado bastantes experimentos (XOR-Problema, MNIST, algunas cosas de Regresión, ...) ahora, me cuesta elegir la función de costo "correcta" para problemas específicos porque en general podría ser considerado un principiante. Antes de venir a TensorFlow, codifiqué algunos MLP completamente …

11
Ciencia de datos en C (o C ++)
Soy un Rprogramador de idiomas. También estoy en el grupo de personas que se consideran científicos de datos pero que provienen de disciplinas académicas distintas de la CS. Sin embargo, esto funciona bien en mi papel como Científico de Datos, al comenzar mi carrera Ry tener solo conocimientos básicos de …



9
¿Alguna consola R en línea?
Estoy buscando una consola en línea para el idioma R. Al igual que escribo el código y el servidor debe ejecutarse y proporcionarme la salida. Similar al sitio web Datacamp.
24 r  statistics 


4
¿Cómo especificar atributos importantes?
Suponga un conjunto de datos poco estructurados (por ejemplo, tablas web / datos abiertos vinculados), compuestos de muchas fuentes de datos. No existe un esquema común seguido de los datos y cada fuente puede usar atributos de sinónimos para describir los valores (por ejemplo, "nacionalidad" frente a "bornIn"). Mi objetivo …



3
¿Cuándo son engañosos los valores p?
¿Cuáles son las condiciones de datos que debemos tener en cuenta, donde los valores p pueden no ser la mejor manera de decidir la significación estadística? ¿Existen tipos de problemas específicos que caen en esta categoría?

1
Cuántas características para muestrear usando bosques aleatorios
La página de Wikipedia que cita "Los elementos del aprendizaje estadístico" dice: Por lo general, para un problema de clasificación con características , ⌊ √pagpagp características p ⌋se utilizan en cada división.⌊ p-√⌋⌊pag⌋\lfloor \sqrt{p}\rfloor Entiendo que esta es una conjetura bastante buena y probablemente fue confirmada por evidencia empírica, pero …


6
Conjuntos de datos que comprenden las mejores prácticas
Soy un estudiante de maestría de CS en minería de datos. Mi supervisor me dijo una vez que antes de ejecutar cualquier clasificador o hacer algo con un conjunto de datos, debo entender completamente los datos y asegurarme de que estén limpios y correctos. Mis preguntas: ¿Cuáles son las mejores …

3
¿Hay algún buen modelo de lenguaje listo para usar para Python?
Estoy creando prototipos de una aplicación y necesito un modelo de lenguaje para calcular la perplejidad en algunas oraciones generadas. ¿Hay algún modelo de lenguaje entrenado en Python que pueda usar fácilmente? Algo simple como model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.