Preguntas etiquetadas con sampling

Crear muestras de una población bien especificada utilizando un método probabilístico y / o produciendo números aleatorios a partir de una distribución especificada. Como esta etiqueta es ambigua, considere [muestreo-encuesta] para el primero y [monte-carlo] o [simulación] para el segundo. Para preguntas relacionadas con la creación de muestras aleatorias a partir de distribuciones conocidas, considere usar la etiqueta [generación aleatoria].

2
¿Cómo elegir la capacitación, la validación cruzada y los tamaños de los conjuntos de prueba para datos de tamaño de muestra pequeño?
Suponga que tengo un tamaño de muestra pequeño, por ejemplo, N = 100 y dos clases. ¿Cómo debo elegir la capacitación, la validación cruzada y los tamaños de los conjuntos de prueba para el aprendizaje automático? Yo elegiría intuitivamente Tamaño del set de entrenamiento como 50 Conjunto de validación cruzada …

3
¿Cómo afectaría la revaloración de los datos de diversidad de American Community Survey a sus márgenes de error?
Antecedentes: mi organización actualmente compara sus estadísticas de diversidad de la fuerza laboral (por ejemplo,% de personas con discapacidades,% de mujeres,% de veteranos) con la disponibilidad total de la fuerza laboral para esos grupos según la Encuesta sobre la Comunidad Estadounidense (un proyecto de encuestas de la Oficina del Censo …


1
¿Por qué Anova () y drop1 () proporcionaron diferentes respuestas para GLMM?
Tengo un GLMM de la forma: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Cuando lo uso drop1(model, test="Chi"), obtengo resultados diferentes a los que uso Anova(model, type="III")del paquete del automóvil o summary(model). Estos dos últimos dan las mismas respuestas. Usando un montón de …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 




4
Varianza de resistencias en paralelo.
Supongamos que tiene un conjunto de resistencias R, todas las cuales se distribuyen con media μ y varianza σ. Considere una sección de un circuito con el siguiente diseño: (r) || (r + r) || (r + r + r). La resistencia equivalente de cada parte es r, 2r y …

1
R regresión lineal variable categórica valor "oculto"
Este es solo un ejemplo que he encontrado varias veces, por lo que no tengo ningún dato de muestra. Ejecutar un modelo de regresión lineal en R: a.lm = lm(Y ~ x1 + x2) x1Es una variable continua. x2es categórico y tiene tres valores, por ejemplo, "Bajo", "Medio" y "Alto". …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 


1
Método de muestreo simple para un estimador de densidad de kernel
Desarrollé un estimador de densidad de kernel simple en Java, basado en unas pocas docenas de puntos (tal vez hasta cien) y una función de kernel gaussiana. La implementación me da el PDF y el CDF de mi distribución de probabilidad en cualquier momento. Ahora me gustaría implementar un método …
10 sampling  pdf  kde 

1
¿Qué modelo de aprendizaje profundo puede clasificar categorías que no son mutuamente excluyentes?
Ejemplos: Tengo una oración en la descripción del trabajo: "Ingeniero senior de Java en el Reino Unido". Quiero usar un modelo de aprendizaje profundo para predecirlo en 2 categorías: English y IT jobs. Si uso el modelo de clasificación tradicional, solo puede predecir 1 etiqueta con softmaxfunción en la última …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
Posibilidad de que la muestra de bootstrap sea exactamente la misma que la muestra original
Solo quiero revisar algunos razonamientos. Si mi muestra original es de tamaño arranco, mi proceso de pensamiento es el siguiente:nortenorten 1norte1norte\frac{1}{n} es la posibilidad de cualquier observación extraída de la muestra original. Para garantizar que el próximo sorteo no sea la observación muestreada anteriormente, restringimos el tamaño de la muestra …

2
Tamaño de las muestras de bootstrap
Estoy aprendiendo sobre bootstrapping como un medio para estimar la varianza de una estadística de muestra. Tengo una duda básica Citando de http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • ¿Cuántas observaciones deberíamos volver a muestrear? Una buena sugerencia es el tamaño de muestra original. ¿Cómo podemos volver a muestrear tantas observaciones como en la …

2
¿Cómo muestrear desde una distribución discreta en los enteros no negativos?
Tengo la siguiente distribución discreta, donde son constantes conocidas:α,βα,β\alpha,\beta p ( x ; α , β) = Beta ( α + 1 , β+ x )Beta ( α , β)para x = 0 , 1 , 2 , ...pag(X;α,β)=Beta(α+1,β+X)Beta(α,β)para X=0 0,1,2,... p(x;\alpha,\beta) = \frac{\text{Beta}(\alpha+1, \beta+x)}{\text{Beta}(\alpha,\beta)} \;\;\;\;\text{for } x = 0,1,2,\dots …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.