Estadísticas y Big Data

Preguntas y respuestas para personas interesadas en estadísticas, aprendizaje automático, análisis de datos, minería de datos y visualización de datos.

3
¿Diagnósticos para regresión logística?
Para la regresión lineal, podemos verificar las gráficas de diagnóstico (gráficas de residuos, gráficas QQ normales, etc.) para verificar si se violan los supuestos de la regresión lineal. Para la regresión logística, tengo problemas para encontrar recursos que expliquen cómo diagnosticar el ajuste del modelo de regresión logística. Desenterrando algunas …

29
Ejemplos para la enseñanza: correlación no significa causalidad
Hay un viejo dicho: "Correlación no significa causalidad". Cuando enseño, tiendo a usar los siguientes ejemplos estándar para ilustrar este punto: número de cigüeñas y tasa de natalidad en Dinamarca; número de sacerdotes en América y alcoholismo; a principios del siglo XX se observó que había una fuerte correlación entre …

6
¿Por qué usar el descenso de gradiente para la regresión lineal, cuando hay disponible una solución matemática de forma cerrada?
Estoy tomando los cursos de Machine Learning en línea y aprendí sobre Gradient Descent para calcular los valores óptimos en la hipótesis. h(x) = B0 + B1X ¿Por qué necesitamos usar el Descenso de degradado si podemos encontrar fácilmente los valores con la siguiente fórmula? Esto parece sencillo y sencillo …

5
¿Qué es la regularización en inglés simple?
A diferencia de otros artículos, encontré que la entrada de Wikipedia para este tema es ilegible para una persona que no es matemática (como yo). Comprendí la idea básica, que favoreces modelos con menos reglas. Lo que no entiendo es cómo pasas de un conjunto de reglas a un "puntaje …

4
Una revista de psicología prohibió los valores p y los intervalos de confianza; ¿Es sabio dejar de usarlos?
El 25 de febrero de 2015, la revista Basic and Applied Social Psychology emitió un editorial que prohíbe los valores ppp y los intervalos de confianza de todos los trabajos futuros. Específicamente, dicen (el formato y el énfasis son míos): [...] antes de la publicación, los autores deberán eliminar todos …







6
Elegir un método de agrupamiento
Cuando se utiliza el análisis de conglomerados en un conjunto de datos para agrupar casos similares, es necesario elegir entre una gran cantidad de métodos de agrupamiento y medidas de distancia. A veces, una opción puede influir en la otra, pero hay muchas combinaciones posibles de métodos. ¿Alguien tiene alguna …


6
¿Hay alguna buena razón para usar PCA en lugar de EFA? Además, ¿puede la PCA ser un sustituto del análisis factorial?
En algunas disciplinas, PCA (análisis de componentes principales) se usa sistemáticamente sin ninguna justificación, y PCA y EFA (análisis factorial exploratorio) se consideran sinónimos. Por lo tanto, recientemente utilicé PCA para analizar los resultados de un estudio de validación de escala (21 ítems en la escala Likert de 7 puntos, …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.