Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo


3
¿Qué es LSTM, BiLSTM y cuándo usarlos?
Soy muy nuevo en el aprendizaje profundo y estoy particularmente interesado en saber qué son LSTM y BiLSTM y cuándo usarlos (áreas principales de aplicación). ¿Por qué LSTM y BILSTM son más populares que RNN? ¿Podemos usar estas arquitecturas de aprendizaje profundo en problemas no supervisados?


4
Aprendizaje automático vs Aprendizaje profundo
Estoy un poco confundido por la diferencia entre los términos "Machine Learning" y "Deep Learning". Lo busqué en Google y leí muchos artículos, pero todavía no me queda muy claro. Una definición conocida de Machine Learning por Tom Mitchell es: Un programa informático se dice que aprender de la experiencia …

4
Medida de rendimiento: ¿Por qué se llama recordar?
la precisión es la fracción de instancias recuperadas que son relevantes, mientras que la recuperación (también conocida como sensibilidad) es la fracción de instancias relevantes que se recuperan. Sé su significado, pero no sé por qué se llama recordar . No soy hablante nativo de inglés. Sé que recordar significa …



1
Intuición para el parámetro de regularización en SVM
¿Cómo cambiar el parámetro de regularización en un SVM cambia el límite de decisión para un conjunto de datos no separable? Sería muy útil una respuesta visual y / o algún comentario sobre los comportamientos limitantes (para regularizaciones grandes y pequeñas).
11 svm 


1
Precisión del tren vs Precisión de prueba vs matriz de confusión
Después de desarrollar mi modelo predictivo utilizando Random Forest, obtengo las siguientes métricas: Train Accuracy :: 0.9764634601043997 Test Accuracy :: 0.7933284397683713 Confusion matrix [[28292 1474] [ 6128 889]] Estos son los resultados de este código: training_features, test_features, training_target, test_target, = train_test_split(df.drop(['bad_loans'], axis=1), df['target'], test_size = .3, random_state=12) clf = RandomForestClassifier() …





6
¿Es Excel suficiente para la ciencia de datos?
Estoy en el proceso de preparación para impartir un curso introductorio sobre ciencia de datos utilizando el lenguaje de programación R. Mi audiencia son estudiantes de pregrado con especialización en temas de negocios. Un estudiante universitario de negocios típico no tiene experiencia en programación de computadoras, pero ha tomado algunas …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.