Estadísticas y Big Data r

1

¿Puede la regresión logística de glmnet manejar directamente las variables factoriales (categóricas) sin necesidad de variables ficticias? [cerrado]

Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 3 años . Estoy construyendo una regresión logística en R usando el método LASSO con las funciones cv.glmnetpara seleccionar …

15 r logistic categorical-data lasso glmnet

1

¿Cómo afectarán los efectos aleatorios con solo 1 observación a un modelo mixto lineal generalizado?

Tengo un conjunto de datos en el que la variable que me gustaría usar como efecto aleatorio solo tiene una observación única para algunos niveles. Según las respuestas a las preguntas anteriores, he deducido que, en principio, esto puede estar bien. ¿Puedo ajustar un modelo mixto con sujetos que solo …

14 r mixed-model generalized-linear-model glmm lme4-nlme

3

¿Qué distribución sigue el CDF normal inverso de una variable aleatoria beta?

Supongamos que define: X∼Beta(α,β)X∼Beta(α,β)X\sim\mbox{Beta}(\alpha,\beta) Y∼Φ−1(X)Y∼Φ−1(X)Y\sim \Phi^{-1}(X) donde Φ−1Φ−1\Phi^{-1} es el inverso del CDF de la distribución normal estándar . Mi pregunta es: ¿hay una distribución simple que siga YYY , o que pueda aproximarse a YYY ? Pregunto porque tengo una fuerte sospecha basada en los resultados de la simulación …

14 r normal-distribution mathematical-statistics beta-distribution

2

Diferentes resultados de randomForest a través de caret y el paquete básico randomForest

Estoy un poco confundido: ¿cómo pueden los resultados de un modelo entrenado a través de caret diferir del modelo en el paquete original? Yo leo si se necesita un procesamiento previo antes de la predicción usando FinalModel de RandomForest con el paquete caret? pero no uso ningún preprocesamiento aquí. Entrené …

14 r machine-learning random-forest caret train

1

De exp (coeficientes) a Odds Ratio y su interpretación en regresión logística con factores

Realicé una regresión lineal de aceptación en la universidad contra los puntajes del SAT y los antecedentes familiares / étnicos. Los datos son ficticios. Este es un seguimiento de una pregunta anterior, ya respondida. La pregunta se centra en la recopilación e interpretación de las razones de posibilidades al dejar …

14 r regression logistic

3

¿Cómo calcular la superposición entre densidades de probabilidad empírica?

Estoy buscando un método para calcular el área de superposición entre dos estimaciones de densidad del núcleo en R, como una medida de similitud entre dos muestras. Para aclarar, en el siguiente ejemplo, necesitaría cuantificar el área de la región superpuesta púrpura: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), …

14 r probability pdf kernel-smoothing

1

Prueba de razón de verosimilitud - lmer R - Modelos no anidados

Actualmente estoy revisando algunos trabajos y he encontrado lo siguiente, lo que me parece incorrecto. Se montan dos modelos mixtos (en R) con lmer. Los modelos no están anidados y se comparan mediante pruebas de razón de probabilidad. En resumen, aquí hay un ejemplo reproducible de lo que tengo: set.seed(105) …

14 r lme4-nlme likelihood-ratio nested-models

3

¿Puedo reconstruir una distribución normal a partir del tamaño de la muestra y los valores mínimo y máximo? Puedo usar el punto medio para representar la media

Sé que esto podría ser un poco complicado, estadísticamente, pero este es mi problema. Tengo muchos datos de rango, es decir, el tamaño mínimo, máximo y de muestra de una variable. Para algunos de estos datos también tengo una media, pero no muchos. Quiero comparar estos rangos entre sí para …

14 r normal-distribution estimation missing-data order-statistics

3

Ponderación de datos más recientes en el modelo de bosque aleatorio

Estoy entrenando un modelo de clasificación con Random Forest para discriminar entre 6 categorías. Mis datos transaccionales tienen aproximadamente 60k + observaciones y 35 variables. Aquí hay un ejemplo de cómo se ve aproximadamente. _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | |-------|----------------|-------|-------|--------| |111 | 2013-04-01 | 12 | US | group1 | |222 …

14 r machine-learning classification random-forest

1

¿Cómo extraer muestras aleatorias de una distribución estimada no paramétrica?

Tengo una muestra de 100 puntos que son continuos y unidimensionales. Calculé su densidad no paramétrica utilizando métodos del núcleo. ¿Cómo puedo extraer muestras aleatorias de esta distribución estimada?

14 r sampling kernel-smoothing

3

Comprender la banda de confianza de una regresión polinómica

Estoy tratando de entender el resultado que veo en mi gráfico a continuación. Por lo general, tiendo a usar Excel y obtener una línea de regresión lineal, pero en el siguiente caso estoy usando R y obtengo una regresión polinómica con el comando: ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() Entonces …

14 r regression data-visualization outliers

3

Algoritmo de árbol de regresión con modelos de regresión lineal en cada hoja.

Versión corta: estoy buscando un paquete R que pueda construir árboles de decisión, mientras que cada hoja en el árbol de decisión es un modelo de regresión lineal completo. AFAIK, la biblioteca rpartcrea árboles de decisión donde la variable dependiente es constante en cada hoja. ¿Hay otra biblioteca (o una …

14 r regression rpart cart

1

Regresión de efectos mixtos no lineales en R

Sorprendentemente, no pude encontrar una respuesta a la siguiente pregunta usando Google: Tengo algunos datos biológicos de varias personas que muestran un comportamiento de crecimiento más o menos sigmoide en el tiempo. Por lo tanto, deseo modelarlo utilizando un crecimiento logístico estándar P(t) = k*p0*exp(r*t) / (k+p0*(exp(r*t)-1)) siendo p0 el …

14 r nonlinear-regression mixed-model growth-model

1

¿Un estimador imparcial medio minimiza la desviación absoluta media?

Este es un seguimiento, pero también una pregunta diferente de la anterior . Leí en Wikipedia que " Un estimador imparcial mediano minimiza el riesgo con respecto a la función de pérdida de desviación absoluta, como lo observó Laplace ". Sin embargo, mis resultados de simulación de Monte Carlo no …

14 r unbiased-estimator median lognormal mad

1

¿Es esta una forma aceptable de analizar modelos de efectos mixtos con lme4 en R?

Tengo un conjunto de datos de medidas repetidas desequilibradas para analizar, y he leído que la forma en que la mayoría de los paquetes estadísticos manejan esto con ANOVA (es decir, la suma de cuadrados del tipo III) es incorrecta. Por lo tanto, me gustaría usar un modelo de efectos …

14 r mixed-model lme4-nlme

Preguntas etiquetadas con r