Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo


1
Convergencia en el método k-means de Hartigan-Wong y otros algoritmos
He estado tratando de entender los diferentes algoritmos de agrupación de k-means que se implementan principalmente en el statspaquete del Rlenguaje. Entiendo el algoritmo de Lloyd y el algoritmo en línea de MacQueen. La forma en que los entiendo es la siguiente: Algoritmo de Lloyd: Inicialmente, se eligen observaciones aleatorias …
10 r  clustering  k-means 

2
Pruebas de software para ciencia de datos en R
A menudo uso Nose, Tox o Unittest cuando pruebo mi código de Python, especialmente cuando tiene que integrarse con otros módulos u otras piezas de código. Sin embargo, ahora que me he encontrado usando R más que python para el modelado y desarrollo de ML. Me di cuenta de que …



1
Texto-Clasificación-Problema: ¿Es Word2Vec / NN el mejor enfoque?
Estoy buscando diseñar un sistema que, dado un párrafo de texto, pueda clasificarlo e identificar el contexto: Está entrenado con párrafos de texto generados por el usuario (como comentarios / preguntas / respuestas) Se etiquetará cada elemento del conjunto de entrenamiento. Entonces, por ejemplo, ("categoría 1", "párrafo de texto") Habrá …

2
Aprendizaje Cooperativo de Refuerzo
Ya tengo una implementación para un solo agente que trabaja en un problema de fijación de precios dinámico con el objetivo de maximizar los ingresos. Sin embargo, el problema con el que estoy trabajando implica varios productos diferentes que son reemplazos entre sí, por lo que el precio dinámico de …

1
Transformando AutoEncoders
Acabo de leer el artículo de Geoff Hinton sobre la transformación de autoencoders Hinton, Krizhevsky y Wang: Transformando codificadores automáticos . En Redes Neuronales Artificiales y Aprendizaje Automático, 2011. y me gustaría jugar con algo como esto. Pero después de leerlo, no pude obtener suficientes detalles del documento sobre cómo …



5
LSTM u otro paquete RNN para R
Vi algunos resultados impresionantes de los modelos LSTM que producen textos similares a Shakespeare. Me preguntaba si existe un paquete LSTM para R. Busqué en Google pero solo encontré paquetes para Python y Julia. (tal vez haya algún problema de rendimiento que explique por qué estos programas son más preferidos …
10 r  neural-network  rnn 




1
Spark, dividiendo de manera óptima un solo RDD en dos
Tengo un gran conjunto de datos que necesito dividir en grupos de acuerdo con parámetros específicos. Quiero que el trabajo se procese de la manera más eficiente posible. Puedo imaginar dos formas de hacerlo Opción 1 : crear un mapa a partir del RDD original y filtrar def customMapper(record): if …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.