Estadísticas y Big Data

Preguntas y respuestas para personas interesadas en estadísticas, aprendizaje automático, análisis de datos, minería de datos y visualización de datos.





3
¿Es posible tener un par de variables aleatorias gaussianas para las cuales la distribución conjunta no es gaussiana?
Alguien me hizo esta pregunta en una entrevista de trabajo y le respondí que su distribución conjunta siempre es gaussiana. Pensé que siempre podría escribir un gaussiano bivariado con sus medios, varianza y covarianzas. Me pregunto si puede haber un caso en el que la probabilidad conjunta de dos gaussianos …

11
¿Cuándo debe llamarse la regresión lineal "aprendizaje automático"?
En un coloquio reciente, el resumen del orador afirmó que estaban utilizando el aprendizaje automático. Durante la charla, lo único relacionado con el aprendizaje automático era que realizaban una regresión lineal en sus datos. Después de calcular los coeficientes de mejor ajuste en el espacio de parámetros 5D, compararon estos …


4
PCA y proporción de varianza explicada
En general, ¿qué significa decir que la fracción de la varianza en un análisis como PCA se explica por el primer componente principal? ¿Alguien puede explicar esto intuitivamente pero también dar una definición matemática precisa de lo que significa "varianza explicada" en términos de análisis de componentes principales (PCA)?XXx Para …



1
Interpretando plot.lm ()
Tenía una pregunta sobre la interpretación de las gráficas generadas por plot (lm) en R. Me preguntaba si ustedes podrían decirme cómo interpretar las gráficas de ubicación de escala y apalancamiento residual. Cualquier comentario será bienvenido. Asumir conocimientos básicos de estadística, regresión y econometría.

4
¿Por qué normalizar las imágenes restando la media de la imagen del conjunto de datos, en lugar de la media de la imagen actual en el aprendizaje profundo?
Existen algunas variaciones sobre cómo normalizar las imágenes, pero la mayoría parece utilizar estos dos métodos: Reste la media por canal calculada sobre todas las imágenes (por ejemplo, VGG_ILSVRC_16_layers ) Reste por píxel / canal calculado sobre todas las imágenes (por ejemplo , CNN_S , también vea la red de …



4
¿Cuándo usar gamma GLM?
La distribución gamma puede adoptar una gama bastante amplia de formas, y dado el vínculo entre la media y la varianza a través de sus dos parámetros, parece adecuada para tratar la heterocedasticidad en datos no negativos, de una manera que los OLS transformados logarítmicamente pueden No lo haga sin …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.