Estadísticas y Big Data

Preguntas y respuestas para personas interesadas en estadísticas, aprendizaje automático, análisis de datos, minería de datos y visualización de datos.



2
Gradient Boosting Tree vs Random Forest
El impulso del árbol de gradiente propuesto por Friedman utiliza árboles de decisión como aprendices básicos. Me pregunto si deberíamos hacer que el árbol de decisión base sea lo más complejo posible (completamente desarrollado) o más simple. ¿Hay alguna explicación para la elección? Random Forest es otro método de conjunto …







4
¿Cuál es la regla .632+ en bootstrapping?
Aquí @gung hace referencia a la regla .632+. Una búsqueda rápida en Google no proporciona una respuesta fácil de entender sobre lo que significa esta regla y para qué se utiliza. ¿Alguien aclararía la regla .632+?
107 bootstrap 


6
¿Existe una interpretación intuitiva de
Para una matriz de datos dada (con variables en columnas y puntos de datos en filas), parece que juega un papel importante en las estadísticas. Por ejemplo, es una parte importante de la solución analítica de los mínimos cuadrados ordinarios. O, para PCA, sus vectores propios son los componentes principales …


7
¿Por qué la precisión no es la mejor medida para evaluar los modelos de clasificación?
Esta es una pregunta general que se hizo indirectamente varias veces aquí, pero carece de una única respuesta autorizada. Sería genial tener una respuesta detallada a esto para la referencia. La precisión , la proporción de clasificaciones correctas entre todas las clasificaciones, es una medida muy simple y muy "intuitiva", …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.