Preguntas etiquetadas con non-independent

Los datos, eventos, procesos, etc., no son independientes si el conocimiento de 1 proporciona alguna información sobre el estado o el valor del otro.

5
Sobre la importancia del supuesto iid en el aprendizaje estadístico
En el aprendizaje estadístico, implícita o explícitamente, siempre se supone que el conjunto de entrenamiento D={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \} está compuesto de NNN tuplas de entrada / respuesta (Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) que se extraen independientemente de la misma distribución conjunta P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) con p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) …


5
El significado de "dependencia positiva" como condición para usar el método habitual para el control FDR
Benjamini y Hochberg desarrollaron el primer método (y aún más utilizado, creo) para controlar la tasa de descubrimiento falso (FDR). Quiero comenzar con un montón de valores de P, cada uno para una comparación diferente, y decidir cuáles son lo suficientemente bajos como para ser llamados un "descubrimiento", controlando el …

7
¿Es la correlación equivalente a la asociación?
Mi profesor de estadística afirma que la palabra "correlación" se aplica estrictamente a las relaciones lineales entre variables, mientras que la palabra "asociación" se aplica ampliamente a cualquier tipo de relación. En otras palabras, afirma que el término "correlación no lineal" es un oxímoron. Por lo que puedo hacer de …

1
Propiedades de PCA para observaciones dependientes
Usualmente usamos PCA como técnica de reducción de dimensionalidad para datos donde se supone que los casos son iid Pregunta: ¿Cuáles son los matices típicos en la aplicación de PCA para datos dependientes que no son iid? ¿Qué propiedades agradables / útiles de PCA que se mantienen para los datos …

1
¿Significado en lenguaje sencillo de pruebas "dependientes" e "independientes" en la literatura de comparaciones múltiples?
Tanto en la literatura de la tasa de error familiar (FWER) como de la tasa de descubrimiento falso (FDR), se dice que métodos particulares para controlar FWER o FDR son apropiados para pruebas dependientes o independientes. Por ejemplo, en el artículo de 1979 "Un procedimiento de prueba múltiple secuencialmente rechazado …

3
Para la intuición, ¿cuáles son algunos ejemplos de la vida real de variables aleatorias no correlacionadas pero dependientes?
Al explicar por qué no correlacionado no implica independiente, hay varios ejemplos que involucran un montón de variables aleatorias, pero todas parecen tan abstractas: 1 2 3 4 . Esta respuesta parece tener sentido. Mi interpretación: una variable aleatoria y su cuadrado pueden no estar correlacionados (ya que aparentemente la …

1
¿Por qué los modelos de efectos mixtos resuelven la dependencia?
Digamos que estamos interesados ​​en cómo las calificaciones de los exámenes de los estudiantes se ven afectadas por la cantidad de horas que esos estudiantes estudian. Para explorar esta relación, podríamos ejecutar la siguiente regresión lineal: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i Pero si tomamos muestras …

1
Modelado lineal de efectos mixtos con datos de estudios gemelos
Supongamos que tengo alguna variable de respuesta yijyijy_{ij} que se midió a partir del hermano jjj en la familia iii . Además, se recopilaron algunos datos de comportamiento xijxijx_{ij} al mismo tiempo de cada sujeto. Estoy tratando de analizar la situación con el siguiente modelo lineal de efectos mixtos: yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} …




5
¿Cómo realizar la imputación de valores en una gran cantidad de puntos de datos?
Tengo un conjunto de datos muy grande y faltan alrededor del 5% de valores aleatorios. Estas variables están correlacionadas entre sí. El siguiente conjunto de datos R de ejemplo es solo un ejemplo de juguete con datos correlacionados ficticios. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


6
¿Qué tan problemático es controlar las covariables no independientes en un estudio observacional (es decir, no aleatorio)?
Miller y Chapman (2001) sostienen que es absolutamente inapropiado controlar las covariables no independientes que están relacionadas con las variables independientes y dependientes en un estudio observacional (no aleatorio), a pesar de que esto se hace rutinariamente en las ciencias sociales. ¿Qué tan problemático es hacerlo? ¿Cuál es la mejor …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.