Estadísticas y Big Data

Preguntas y respuestas para personas interesadas en estadísticas, aprendizaje automático, análisis de datos, minería de datos y visualización de datos.


7
Al realizar una regresión múltiple, ¿cuándo debería centrar sus variables predictoras y cuándo debería estandarizarlas?
En cierta literatura, he leído que una regresión con múltiples variables explicativas, si está en unidades diferentes, necesitaba ser estandarizada. (La estandarización consiste en restar la media y dividirla por la desviación estándar). ¿En qué otros casos necesito estandarizar mis datos? ¿Hay casos en los que solo debería centrar mis …


6
¿Cómo normalizar los datos al rango 0-1?
Estoy perdido en la normalización, ¿podría alguien guiarme por favor? Tengo valores mínimos y máximos, digamos -23.89 y 7.54990767, respectivamente. Si obtengo un valor de 5.6878, ¿cómo puedo escalar este valor en una escala de 0 a 1?

11
¿Cómo entender los grados de libertad?
De Wikipedia , hay tres interpretaciones de los grados de libertad de una estadística: En estadística, el número de grados de libertad es el número de valores en el cálculo final de una estadística que pueden variar libremente . Las estimaciones de los parámetros estadísticos pueden basarse en diferentes cantidades …


16
¿Cuál es el significado de los valores p y los valores t en las pruebas estadísticas?
Después de tomar un curso de estadística y luego tratar de ayudar a otros estudiantes, noté que un tema que inspira mucho golpear el escritorio es interpretar los resultados de las pruebas de hipótesis estadísticas. Parece que los estudiantes aprenden fácilmente cómo realizar los cálculos requeridos por una prueba determinada, …


8
¿Por qué la distancia euclidiana no es una buena métrica en altas dimensiones?
Leí que "la distancia euclidiana no es una buena distancia en grandes dimensiones". Supongo que esta afirmación tiene algo que ver con la maldición de la dimensionalidad, pero ¿qué es exactamente? Además, ¿qué son las "altas dimensiones"? He estado aplicando agrupamiento jerárquico usando la distancia euclidiana con 100 características. ¿Hasta …


2
Interpretación de la salida lm () de R
Las páginas de ayuda en R suponen que sé lo que significan esos números, pero no lo sé. Estoy tratando de entender intuitivamente cada número aquí. Solo publicaré el resultado y comentaré lo que descubrí. Puede haber (habrá) errores, ya que escribiré lo que supongo. Principalmente me gustaría saber qué …

6
¿
Estaba hojeando algunas notas de clase de Cosma Shalizi (en particular, la sección 2.1.1 de la segunda clase ), y me recordó que puedes obtener muy bajo incluso cuando tienes un modelo completamente lineal.R2R2R^2 Parafraseando el ejemplo de Shalizi: suponga que tiene un modelo , donde es conocida. Entonces \ …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.