Preguntas etiquetadas con r

Use esta etiqueta para cualquier pregunta * sobre el tema * que (a) involucre a `R` como parte crítica de la pregunta o respuesta esperada, y (b) no es * solo * sobre cómo usar` R`.

1
¿Puede la regresión logística de glmnet manejar directamente las variables factoriales (categóricas) sin necesidad de variables ficticias? [cerrado]
Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 3 años . Estoy construyendo una regresión logística en R usando el método LASSO con las funciones cv.glmnetpara seleccionar …


3
¿Qué distribución sigue el CDF normal inverso de una variable aleatoria beta?
Supongamos que define: X∼Beta(α,β)X∼Beta(α,β)X\sim\mbox{Beta}(\alpha,\beta) Y∼Φ−1(X)Y∼Φ−1(X)Y\sim \Phi^{-1}(X) donde Φ−1Φ−1\Phi^{-1} es el inverso del CDF de la distribución normal estándar . Mi pregunta es: ¿hay una distribución simple que siga YYY , o que pueda aproximarse a YYY ? Pregunto porque tengo una fuerte sospecha basada en los resultados de la simulación …



3
¿Cómo calcular la superposición entre densidades de probabilidad empírica?
Estoy buscando un método para calcular el área de superposición entre dos estimaciones de densidad del núcleo en R, como una medida de similitud entre dos muestras. Para aclarar, en el siguiente ejemplo, necesitaría cuantificar el área de la región superpuesta púrpura: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), …


3
¿Puedo reconstruir una distribución normal a partir del tamaño de la muestra y los valores mínimo y máximo? Puedo usar el punto medio para representar la media
Sé que esto podría ser un poco complicado, estadísticamente, pero este es mi problema. Tengo muchos datos de rango, es decir, el tamaño mínimo, máximo y de muestra de una variable. Para algunos de estos datos también tengo una media, pero no muchos. Quiero comparar estos rangos entre sí para …

3
Ponderación de datos más recientes en el modelo de bosque aleatorio
Estoy entrenando un modelo de clasificación con Random Forest para discriminar entre 6 categorías. Mis datos transaccionales tienen aproximadamente 60k + observaciones y 35 variables. Aquí hay un ejemplo de cómo se ve aproximadamente. _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | |-------|----------------|-------|-------|--------| |111 | 2013-04-01 | 12 | US | group1 | |222 …




1
Regresión de efectos mixtos no lineales en R
Sorprendentemente, no pude encontrar una respuesta a la siguiente pregunta usando Google: Tengo algunos datos biológicos de varias personas que muestran un comportamiento de crecimiento más o menos sigmoide en el tiempo. Por lo tanto, deseo modelarlo utilizando un crecimiento logístico estándar P(t) = k*p0*exp(r*t) / (k+p0*(exp(r*t)-1)) siendo p0 el …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.