Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo

1
Entonces, ¿cuál es el problema con LSTM?
Estoy ampliando mi conocimiento del paquete Keras y he estado trabajando con algunos de los modelos disponibles. Tengo un problema de clasificación binaria de PNL que estoy tratando de resolver y he estado aplicando diferentes modelos. Después de trabajar con algunos resultados y leer más y más sobre LSTM, parece …


4
Detección de anomalías con la red neuronal.
Tengo un gran conjunto de datos multidimensionales que se genera cada día. ¿Cuál sería un buen enfoque para detectar cualquier tipo de 'anomalía' en comparación con los días anteriores? ¿Es este un problema adecuado que podría abordarse con redes neuronales? Cualquier sugerencia es apreciada. información adicional: no hay ejemplos, por …



3
¿Cómo usar RBM para la clasificación?
En este momento estoy jugando con Restricted Boltzmann Machines y, dado que estoy allí, me gustaría tratar de clasificar los dígitos escritos a mano. El modelo que creé ahora es un modelo generativo bastante elegante, pero no sé cómo ir más allá. En este artículo, el autor dice que después …


2
¿Cuántas dimensiones hay que reducir al hacer PCA?
¿Cómo elegir K para PCA? K es el número de dimensiones para proyectar hacia abajo. El único requisito es no perder demasiada información. Entiendo que depende de los datos, pero estoy buscando más una descripción general simple sobre qué características considerar al elegir K.
12 pca 



1
MinHashing vs SimHashing
Supongamos que tengo cinco conjuntos que me gustaría agrupar. Entiendo que la técnica SimHashing descrita aquí: https://moultano.wordpress.com/2010/01/21/simple-simhashing-3kbzhsxyg4467-6/ podría producir tres grupos ( {A}, {B,C,D}y {E}), por ejemplo, si sus resultados fueran: A -> h01 B -> h02 C -> h02 D -> h02 E -> h03 Del mismo modo, la …

7
¿Qué es un 'antiguo nombre' de científico de datos?
Términos como 'ciencia de datos' y 'científico de datos' se usan cada vez más en estos días. Muchas empresas están contratando 'científico de datos'. Pero no creo que sea un trabajo completamente nuevo. Los datos han existido en el pasado y alguien tuvo que lidiar con los datos. Supongo que …
12 bigdata 

2
Tarifas de aerolíneas: ¿qué análisis se debe utilizar para detectar comportamientos competitivos de fijación de precios y correlaciones de precios?
Quiero investigar el comportamiento de fijación de precios de las aerolíneas, específicamente cómo las aerolíneas reaccionan a los precios de la competencia. Como diría, mi conocimiento sobre análisis más complejos es bastante limitado. He realizado principalmente todos los métodos básicos para obtener una visión general de los datos. Esto incluye …

1
Truco de hash: lo que realmente sucede
Cuando los algoritmos de ML, por ejemplo, Vowpal Wabbit o algunas de las máquinas de factorización que ganan concursos de clics ( Kaggle ), mencionan que las características son 'hash', ¿qué significa eso realmente para el modelo? Digamos que hay una variable que representa la ID de un complemento de …

2
Datos de sentimiento para Emoji
Para experimentar, nos gustaría usar el Emoji incorporado en muchos Tweets como datos de verdad / entrenamiento básicos para un simple análisis cuantitativo de opiniones. Los tweets generalmente no están estructurados para que la PNL funcione bien. De todos modos, hay 722 Emoji en Unicode 6.0, y probablemente se agregarán …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.