Estadísticas y Big Data

Preguntas y respuestas para personas interesadas en estadísticas, aprendizaje automático, análisis de datos, minería de datos y visualización de datos.




8
Generar una variable aleatoria con una correlación definida con una variable o variables existentes
Para un estudio de simulación tengo para generar variables aleatorias que muestran un (población) de correlación prefined a una variable existente .YYY Miré en los Rpaquetes copulay CDVineque pueden producir distribuciones aleatorias multivariadas con una estructura de dependencia dada. Sin embargo, no es posible arreglar una de las variables resultantes …

4
¿Cómo visualizar lo que hace el análisis de correlación canónica (en comparación con lo que hace el análisis de componentes principales)?
El análisis de correlación canónica (CCA) es una técnica relacionada con el análisis de componentes principales (PCA). Si bien es fácil enseñar PCA o regresión lineal utilizando un diagrama de dispersión (vea algunos miles de ejemplos en la búsqueda de imágenes de Google), no he visto un ejemplo bidimensional intuitivo …


9
¿Cuáles son las principales diferencias filosóficas, metodológicas y terminológicas entre la econometría y otros campos estadísticos?
La econometría tiene una superposición sustancial con las estadísticas tradicionales, pero a menudo usa su propia jerga sobre una variedad de temas ("identificación", "exógena", etc.). Una vez escuché a un profesor de estadística aplicada en otro campo comentar que frecuentemente la terminología es diferente pero los conceptos son los mismos. …




9
¿Qué algoritmo debo usar para detectar anomalías en series temporales?
Antecedentes Estoy trabajando en el Centro de operaciones de red, supervisamos los sistemas informáticos y su rendimiento. Una de las métricas clave para monitorear es una cantidad de visitantes \ clientes actualmente conectados a nuestros servidores. Para hacerlo visible, nosotros (el equipo de Ops) recopilamos métricas como datos de series …

1
¿Cómo dividir el conjunto de datos para la validación cruzada, la curva de aprendizaje y la evaluación final?
¿Cuál es una estrategia adecuada para dividir el conjunto de datos? Pido retroalimentación en el enfoque siguiente (no en los parámetros individuales tales como test_sizeo n_iter, pero si utilicé X, y, X_train, y_train, X_test, y y_testde manera adecuada y si la secuencia tiene sentido): (ampliando este ejemplo de la documentación …


2
¿Cómo funciona la capa de 'incrustación' de Keras?
Necesita comprender el funcionamiento de la capa 'Incrustación' en la biblioteca Keras. Ejecuto el siguiente código en Python import numpy as np from keras.models import Sequential from keras.layers import Embedding model = Sequential() model.add(Embedding(5, 2, input_length=5)) input_array = np.random.randint(5, size=(1, 5)) model.compile('rmsprop', 'mse') output_array = model.predict(input_array) que da el siguiente …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.