Preguntas etiquetadas con data-imputation

Se refiere a una clase general de métodos utilizados para "completar" los datos faltantes. Los métodos utilizados para hacer esto generalmente están relacionados con la interpolación (http://en.wikipedia.org/wiki/Interpolation) y requieren suposiciones sobre por qué faltan los datos (por ejemplo, "falta al azar")





2
¿Qué es mejor, reemplazo por medio y reemplazo por mediana?
Estoy haciendo un proyecto que implica reemplazar los valores faltantes en un conjunto de datos (la primera vez que lo hago). Esto implica el uso de dos métodos replacement by meany replacement by mediancompletar los valores faltantes. No hay mucha diferencia entre los resultados de la desviación mínima, mediana, máxima, …

1
Imputación de una variable censurada
Tengo un conjunto de datos médicos con aproximadamente 200 variables. Una de las variables es un marcador biológico (concentración de una enzima particular). Su distribución es correcta, y el problema es que los valores por encima de cierto nivel están censurados / cortados en ese nivel. Entonces, mientras que la …



3
Cómo realizar SVD para imputar valores perdidos, un ejemplo concreto
He leído los excelentes comentarios sobre cómo lidiar con los valores perdidos antes de aplicar SVD, pero me gustaría saber cómo funciona con un ejemplo simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada la matriz anterior, …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

2
¿Cómo combinar múltiples conjuntos de datos imputados?
Necesito un único conjunto de datos imputados (por ejemplo, para crear un grupo ficticio del grupo imputado a partir de los datos de ingreso per cápita del país imputado). R ofrece paquetes de paquetes para crear múltiples datos imputados (por ejemplo, Amelia) y combinar resultados de múltiples conjuntos de datos …



2
Tasas faltantes e imputación múltiple
¿Existe un límite que sea el menos aceptable cuando se usa la imputación múltiple (MI)? Por ejemplo, ¿puedo usar MI si los valores faltantes en una variable son el 20% de los casos mientras que otras variables tienen valores perdidos pero no a un nivel tan alto?
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.