Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo




1
Diferencia entre isna () e isnull () en pandas
He estado usando pandas por bastante tiempo. Pero, no entendí cuál es la diferencia entre isna()y isnull()en los pandas. Y, lo que es más importante, cuál usar para identificar los valores faltantes en el marco de datos. ¿Cuál es la diferencia básica subyacente de cómo se detecta un valor como …

11
¿Por qué la gente prefiere Pandas a SQL?
He estado usando SQL desde 1996, por lo que puedo estar sesgado. He usado MySQL y SQLite 3 ampliamente, pero también he usado Microsoft SQL Server y Oracle. La gran mayoría de las operaciones que he visto con Pandas se pueden hacer más fácilmente con SQL. Esto incluye filtrar un …
69 pandas  sql 


8
Científico de datos vs ingeniero de aprendizaje automático
¿Cuáles son las diferencias, si las hay, entre un "científico de datos" y un "ingeniero de aprendizaje automático"? Durante el año pasado, el "ingeniero de aprendizaje automático" comenzó a aparecer mucho en las ofertas de trabajo. Esto es particularmente notable en San Francisco, que es posiblemente el origen del término …


3
Ventajas de AUC vs precisión estándar
Estaba empezando a mirar el área bajo la curva (AUC) y estoy un poco confundido acerca de su utilidad. Cuando me lo explicaron por primera vez, el AUC parecía ser una gran medida de rendimiento, pero en mi investigación descubrí que algunos afirman que su ventaja es mayormente marginal, ya …


1
¿Cómo obtener la correlación entre dos variables categóricas y una variable categórica y una variable continua?
Estoy construyendo un modelo de regresión y necesito calcular lo siguiente para verificar las correlaciones Correlación entre 2 variables categóricas multinivel Correlación entre una variable categórica de niveles múltiples y una variable continua VIF (factor de inflación de varianza) para variables categóricas de niveles múltiples Creo que es incorrecto usar …


3
Backprop a través de Max-Pooling Layers?
Esta es una pequeña pregunta conceptual que me ha estado molestando por un tiempo: ¿Cómo podemos propagarnos a través de una capa de agrupación máxima en una red neuronal? Me encontré con capas de agrupación máxima mientras revisaba este tutorial para la biblioteca nn de Torch 7. La biblioteca abstrae …


11
¿Qué es la reducción de dimensionalidad? ¿Cuál es la diferencia entre la selección y extracción de características?
De wikipedia, La reducción de dimensionalidad o reducción de dimensión es el proceso de reducir el número de variables aleatorias bajo consideración, y puede dividirse en selección de características y extracción de características. ¿Cuál es la diferencia entre la selección de características y la extracción de características? ¿Cuál es un …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.