Estadísticas y Big Data kernel-smoothing

2

Hay varios usos distintos: estimación de la densidad del grano truco del grano suavizado de granos Por favor explique lo que significa el "núcleo" en ellos, en inglés simple, en sus propias palabras.

73 kernel-trick kernel-smoothing

4

¿Buenos métodos para gráficos de densidad de variables no negativas en R?

plot(density(rexp(100)) Obviamente, toda la densidad a la izquierda de cero representa sesgo. Estoy buscando resumir algunos datos para los no estadísticos, y quiero evitar preguntas sobre por qué los datos no negativos tienen densidad a la izquierda de cero. Las parcelas son para verificación de aleatorización; Quiero mostrar las distribuciones …

36 r pdf gamma-distribution kernel-smoothing

2

Elegir un ancho de banda para estimadores de densidad del núcleo

Para los estimadores de densidad de kernel univariados (KDE), uso la regla de Silverman para calcular :hhh 0.9min(sd,IQR/1.34)×n−0.20.9min(sd,IQR/1.34)×n−0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} ¿Cuáles son las reglas estándar para KDE multivariante (suponiendo un núcleo normal)?

29 smoothing kernel-smoothing

1

¿La "estimación de la densidad del núcleo" es una convolución de qué?

Estoy tratando de comprender mejor la estimación de la densidad del kernel. Usando la definición de Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition fh^(x)=1n∑ni=1Kh(x−xi)=1nh∑ni=1K(x−xih)fh^(x)=1n∑i=1nKh(x−xi)=1nh∑i=1nK(x−xih) \hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) \quad = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big) Tomemos como una función rectangular que da si está entre y y contrario, y (tamaño de la ventana) es …

25 r kernel-smoothing convolution

2

¿Puede explicar la estimación de densidad de la ventana de Parzen (núcleo) en términos simples?

La estimación de la densidad de la ventana de Parzen se describe como p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) donde nnn es el número de elementos en el vector, es un vector, es una densidad de probabilidad de , es la dimensión de la ventana de Parzen y …

24 pdf kernel-smoothing intuition density-estimation

4

¿Cómo proyectar un nuevo vector en el espacio PCA?

Después de realizar el análisis de componentes principales (PCA), quiero proyectar un nuevo vector en el espacio PCA (es decir, encontrar sus coordenadas en el sistema de coordenadas PCA). He calculado PCA en lenguaje R usando prcomp. Ahora debería poder multiplicar mi vector por la matriz de rotación PCA. ¿Deben …

21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

2

Si el núcleo Epanechnikov es teóricamente óptimo cuando se hace la Estimación de la densidad del núcleo, ¿por qué no se usa más comúnmente?

He leído (por ejemplo, aquí ) que el núcleo Epanechnikov es óptimo, al menos en un sentido teórico, al hacer la estimación de la densidad del núcleo. Si esto es cierto, ¿por qué el gaussiano aparece con tanta frecuencia como el núcleo predeterminado, o en muchos casos el único núcleo, …

18 nonparametric kernel-smoothing

2

Si los anchos variables del núcleo a menudo son buenos para la regresión del núcleo, ¿por qué generalmente no son buenos para la estimación de la densidad del núcleo?

Esta pregunta es provocada por la discusión en otra parte . Los núcleos variables a menudo se usan en regresión local. Por ejemplo, loess se usa ampliamente y funciona bien como una regresión más suave, y se basa en un núcleo de ancho variable que se adapta a la escasez …

17 nonparametric smoothing kernel-smoothing loess

1

¿Cuál es la intuición detrás de las muestras intercambiables bajo la hipótesis nula?

Las pruebas de permutación (también llamadas prueba de aleatorización, prueba de aleatorización o prueba exacta) son muy útiles y resultan útiles cuando t-testno se cumple el supuesto de distribución normal requerido por ejemplo y cuando se transforman los valores mediante la clasificación de prueba no paramétrica como Mann-Whitney-U-testconduciría a la …

15 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

2

Área bajo el "pdf" en la estimación de densidad del núcleo en R

Estoy tratando de usar la función ' densidad ' en R para hacer estimaciones de densidad del núcleo. Tengo algunas dificultades para interpretar los resultados y comparar varios conjuntos de datos, ya que parece que el área bajo la curva no es necesariamente 1. Para cualquier función de densidad de …

15 r estimation pdf kernel-smoothing auc

3

¿Cómo calcular la superposición entre densidades de probabilidad empírica?

Estoy buscando un método para calcular el área de superposición entre dos estimaciones de densidad del núcleo en R, como una medida de similitud entre dos muestras. Para aclarar, en el siguiente ejemplo, necesitaría cuantificar el área de la región superpuesta púrpura: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), …

14 r probability pdf kernel-smoothing

1

¿Cómo extraer muestras aleatorias de una distribución estimada no paramétrica?

Tengo una muestra de 100 puntos que son continuos y unidimensionales. Calculé su densidad no paramétrica utilizando métodos del núcleo. ¿Cómo puedo extraer muestras aleatorias de esta distribución estimada?

14 r sampling kernel-smoothing

1

¿Existe un ancho de banda óptimo para un estimador de densidad del núcleo de derivados?

Necesito estimar la función de densidad basada en un conjunto de observaciones usando el estimador de densidad del núcleo. Basado en el mismo conjunto de observaciones, también necesito estimar la primera y segunda derivadas de la densidad usando las derivadas del estimador de densidad del núcleo. El ancho de banda …

14 r nonparametric pdf kernel-smoothing

1

Ancho de banda del núcleo: las reglas de Scott contra Silverman

¿Alguien podría explicar en inglés sencillo cuál es la diferencia entre las reglas generales de Scott y Silverman para la selección de ancho de banda? Específicamente, ¿ cuándo es uno mejor que el otro? ¿Está relacionado con la distribución subyacente? ¿Número de muestras? PD: me estoy refiriendo al código en …

14 kernel-smoothing

1

¿Cuál es la varianza a largo plazo?

¿Cómo se define la varianza a largo plazo en el ámbito del análisis de series temporales? Entiendo que se utiliza en el caso de que haya una estructura de correlación en los datos. ¿Entonces nuestro proceso estocástico no sería una familia de X1,X2…X1,X2…X_1, X_2 \dots iid variables aleatorias sino distribuidas …

13 time-series variance references kernel-smoothing non-independent

Preguntas etiquetadas con kernel-smoothing