Preguntas etiquetadas con data-transformation

Reexpresión matemática, a menudo no lineal, de valores de datos. Los datos a menudo se transforman para cumplir con los supuestos de un modelo estadístico o para hacer que los resultados de un análisis sean más interpretables.




3
¿Son estas fórmulas para transformar P, LSD, MSD, HSD, CI, a SE como una estimación exacta o inflada / conservadora de correcta?
Antecedentes Estoy realizando un metanálisis que incluye datos publicados anteriormente. A menudo, las diferencias entre tratamientos se informan con valores de P, diferencias menos significativas (LSD) y otras estadísticas, pero no proporcionan una estimación directa de la varianza. En el contexto del modelo que estoy usando, una sobreestimación de la …


1
Intervalos de confianza transformados hacia atrás
Habiendo encontrado esta discusión , estoy planteando la pregunta sobre las convenciones de los intervalos de confianza transformados hacia atrás. De acuerdo con este artículo, la cobertura nominal transformada por CI para la media de una variable aleatoria logarítmica normal es: UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1)−−−−−−−−−−−−√) UCL(X)=exp⁡(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1))\ UCL(X)= \exp\left(Y+\frac{\text{var}(Y)}{2}+z\sqrt{\frac{\text{var}(Y)}{n}+\frac{\text{var}(Y)^2}{2(n-1)}}\right) LCL(X)=exp(Y+var(Y)2−zvar(Y)n+var(Y)22(n−1)−−−−−−−−−−−−√) LCL(X)=exp⁡(Y+var(Y)2−zvar(Y)n+var(Y)22(n−1))\ LCL(X)= \exp\left(Y+\frac{\text{var}(Y)}{2}-z\sqrt{\frac{\text{var}(Y)}{n}+\frac{\text{var}(Y)^2}{2(n-1)}}\right) / …


2
Transformar variables continuas para regresión logística
Tengo grandes datos de encuestas, una variable de resultado binaria y muchas variables explicativas, incluidas las binarias y las continuas. Estoy creando conjuntos de modelos (experimentando con GLM y GLM mixto) y utilizando enfoques teóricos de información para seleccionar el modelo superior. Examiné cuidadosamente las explicaciones (tanto continuas como categóricas) …


2
Agrupación de datos de recuento muy sesgados: ¿alguna sugerencia para realizar (transformar, etc.)?
Problema básico Aquí está mi problema básico: estoy tratando de agrupar un conjunto de datos que contiene algunas variables muy sesgadas con recuentos. Las variables contienen muchos ceros y, por lo tanto, no son muy informativas para mi procedimiento de agrupación, que probablemente sea el algoritmo k-means. Bien, dices, simplemente …

1
Variables estandarizadas VS centradas
He encontrado muchas publicaciones útiles sobre variables independientes estandarizadas y variables independientes centradas en stats.stackexchange.com, pero todavía estoy un poco confundido. Le pido una evaluación de lo que he entendido. Además, si lo que sigue no es correcto, ¿podría corregirme? Cómo estandarizar Las variables estandarizadas se obtienen restando la media …



3
¿Cómo afectaría la revaloración de los datos de diversidad de American Community Survey a sus márgenes de error?
Antecedentes: mi organización actualmente compara sus estadísticas de diversidad de la fuerza laboral (por ejemplo,% de personas con discapacidades,% de mujeres,% de veteranos) con la disponibilidad total de la fuerza laboral para esos grupos según la Encuesta sobre la Comunidad Estadounidense (un proyecto de encuestas de la Oficina del Censo …

1
¿Cómo incorporo un valor atípico innovador en la observación 48 en mi modelo ARIMA?
Estoy trabajando en un conjunto de datos. Después de usar algunas técnicas de identificación de modelos, obtuve un modelo ARIMA (0,2,1). Utilicé la detectIOfunción en el paquete TSAen R para detectar un valor atípico innovador (IO) en la observación número 48 de mi conjunto de datos original. ¿Cómo incorporo este …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.