Preguntas etiquetadas con dataset

Las solicitudes de conjuntos de datos están fuera de tema en este sitio. Use esta etiqueta para preguntas relacionadas con la creación, el procesamiento o el mantenimiento de conjuntos de datos.

3
La idea de hacer que los datos tengan una media cero
A menudo veo personas que hacen que una dimensión / característica de un conjunto de datos sea de media cero al eliminar la media de todos los elementos. ¿Pero nunca entendí por qué hacerlo? ¿Cuál es el efecto de hacer eso como un paso de preprocesamiento? ¿Mejora el rendimiento de …

2
¿Por qué algunas personas prueban los supuestos del modelo similar a la regresión en sus datos sin procesar y otras personas los prueban en el residual?
Soy un estudiante de doctorado en psicología experimental y me esfuerzo por mejorar mis habilidades y conocimientos sobre cómo analizar mis datos. Hasta mi quinto año en psicología, pensé que los modelos de regresión (por ejemplo, ANOVA) suponen lo siguiente: normalidad de los datos homogeneidad de varianza para los datos, …


1


2
Mejores prácticas para crear 'Tidy Data'
Hadley Wickham escribió un artículo estelar llamado "Tidy Data" ( enlace ) en JSS el año pasado sobre la manipulación de datos y la obtención de los datos en una condición "óptima" para realizar el análisis. Sin embargo, me preguntaba cuáles eran las mejores prácticas en términos de presentar datos …
12 dataset  tables 



3
Práctico tutorial de PCA con datos
Buscar en Internet el tutorial de PCA ofrece miles de resultados (incluso videos). Muchos de los tutoriales son muy buenos. Pero no puedo encontrar ningún ejemplo práctico en el que se explique PCA utilizando algunos conjuntos de datos que puedo usar para la demostración. Necesito un tutorial que proporcione un …

14
¿Cuánta información puedes extraer de un nombre?
Un nombre: primero, posiblemente un segundo nombre y apellido. Tengo curiosidad acerca de cuánta información puede extraer de un nombre, utilizando conjuntos de datos disponibles públicamente. Sé que puede obtener lo siguiente en cualquier lugar entre una probabilidad baja-alta (dependiendo de la entrada) utilizando los datos del censo de EE. …






Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.