Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo



4
¿Cómo hacer direcciones postales coincidencia difusa?
Me gustaría saber cómo hacer coincidir las direcciones postales cuando su formato difiere o cuando uno de ellos está mal escrito. Hasta ahora he encontrado diferentes soluciones, pero creo que son bastante antiguas y poco eficientes. Estoy seguro de que existen algunos métodos mejores, por lo que si tiene referencias …





1
Bibliotecas de aprendizaje automático para Ruby
¿Hay alguna biblioteca de aprendizaje automático para Ruby que sea relativamente completa (incluida una amplia variedad de algoritmos para el aprendizaje supervisado y no supervisado), probada de manera sólida y bien documentada? Me encanta el scikit-learn de Python por su increíble documentación, pero un cliente preferiría escribir el código en …


4
¿Cuáles son las implicaciones para entrenar un conjunto de árboles con conjuntos de datos altamente sesgados?
Tengo un conjunto de datos binarios altamente sesgado: tengo 1000 veces más ejemplos de la clase negativa que la clase positiva. Me gustaría entrenar un conjunto de árboles (como árboles extra aleatorios o un bosque aleatorio) sobre estos datos, pero es difícil crear conjuntos de datos de entrenamiento que contengan …


1
¿Pueden los árboles potenciados por gradiente encajar en alguna función?
Para las redes neuronales tenemos el teorema de aproximación universal que establece que las redes neuronales pueden aproximarse a cualquier función continua en un subconjunto compacto de .RnRnorteR^n ¿Hay un resultado similar para los árboles impulsados ​​por gradiente? Parece razonable ya que puede seguir agregando más ramas, pero no puedo …

1
Cómo agregar características que no son de imagen a lo largo de las imágenes laterales como entrada de CNN
Estoy entrenando una red neuronal convolucional para clasificar imágenes en condiciones de niebla (3 clases). Sin embargo, para cada una de aproximadamente 150,000 imágenes también tengo cuatro variables meteorológicas disponibles que podrían ayudar a predecir las clases de las imágenes. Me preguntaba cómo podría agregar las variables meteorológicas (por ejemplo, …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.