Preguntas etiquetadas con normalization

Por lo general, "normalización" significa volver a expresar los datos para hacer que los valores se encuentren dentro de un rango especificado.





3
¿Qué significa "normalización" y cómo verificar que una muestra o una distribución esté normalizada?
Tengo una pregunta en la que pide verificar si la distribución Uniforme ( Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) ) está normalizada. Por un lado, ¿qué significa que cualquier distribución se normalice? Y dos, ¿cómo hacemos para verificar si una distribución está normalizada o no? Entiendo computando X−meansdX−meansd \frac{X-\text{mean}}{\text{sd}} obtenemosdatosnormalizados, pero aquí se solicita …


4
Normalización previa a la validación cruzada
¿La normalización de datos (para tener una media de desviación estándar de unidad y cero) antes de realizar una validación cruzada repetida de k veces tiene alguna consecuencia negativa como el sobreajuste? Nota: esto es para una situación donde #cases> total #características Estoy transformando algunos de mis datos usando una …

1
¿Cómo funciona la normalización cuantil?
En los estudios de expresión génica que utilizan microarrays, los datos de intensidad deben normalizarse para poder comparar las intensidades entre individuos, entre genes. Conceptualmente y algorítmicamente, ¿cómo funciona la "normalización de cuantiles" y cómo se lo explicaría a un no estadístico?





5
¿Cómo realizar la imputación de valores en una gran cantidad de puntos de datos?
Tengo un conjunto de datos muy grande y faltan alrededor del 5% de valores aleatorios. Estas variables están correlacionadas entre sí. El siguiente conjunto de datos R de ejemplo es solo un ejemplo de juguete con datos correlacionados ficticios. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


6
¿Una medida robusta (no paramétrica) como Coeficiente de variación - IQR / mediana, o alternativa?
Para un conjunto dado de datos, la dispersión a menudo se calcula como la desviación estándar o como el IQR (rango intercuartil). Mientras que a standard deviationestá normalizado (puntajes z, etc.) y, por lo tanto, puede usarse para comparar la propagación de dos poblaciones diferentes, este no es el caso …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.