Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo

1
¿Qué es un puntaje LB en aprendizaje automático?
Estaba leyendo un artículo en los blogs de kaggle. En repetidas ocasiones, el autor menciona 'puntaje LB' y 'ajuste LB') como una métrica para la efectividad del aprendizaje automático (junto con el puntaje de validación cruzada (CV)). Con una investigación sobre el significado de 'LB', pasé bastante tiempo, me di …



2
PNL - ¿Es el Gazetteer un tramposo?
En PNL, existe el concepto de Gazetteerque puede ser bastante útil para crear anotaciones. Hasta donde yo entiendo: Un diccionario geográfico consiste en un conjunto de listas que contienen nombres de entidades como ciudades, organizaciones, días de la semana, etc. Estas listas se utilizan para encontrar las ocurrencias de estos …

2
¿Qué tipos de problemas de aprendizaje son adecuados para las máquinas de vectores de soporte?
¿Cuáles son las características o propiedades que indican que se puede abordar un determinado problema de aprendizaje utilizando máquinas de vectores de soporte? En otras palabras, ¿qué es lo que, cuando ves un problema de aprendizaje, te hace decir "oh, definitivamente debería usar SVM para esto" en lugar de redes …

3
¿Cómo autoaprender la ciencia de datos? [cerrado]
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 4 años . Soy un desarrollador web autodidacta y estoy interesado en enseñarme ciencia de …

6
Podcasts de ciencia de datos?
¿Cuáles son algunos podcasts relacionados con la ciencia de datos? Esta es una pregunta similar a la pregunta de solicitud de referencia en CrossValidated . Detalles / reglas: Los podcasts (el tema y los episodios) deben estar relacionados con la ciencia de datos. (Por ejemplo: un podcast que trata sobre …







5
Elija el algoritmo de clasificación binaria
Tengo un problema de clasificación binaria: Aproximadamente 1000 muestras en conjunto de entrenamiento 10 atributos, incluidos binario, numérico y categórico ¿Qué algoritmo es la mejor opción para este tipo de problema? De manera predeterminada, comenzaré con SVM (preliminar que tiene valores de atributos nominales convertidos en características binarias), ya que …

3
¿Clasificación discriminatoria de una clase con antecedentes negativos desequilibrados y heterogéneos?
Estoy trabajando para mejorar un clasificador supervisado existente, para clasificar las secuencias de {proteína} como pertenecientes a una clase específica (precursores de hormonas neuropéptidas), o no. Hay alrededor de 1.150 "positivos" conocidos, en un contexto de aproximadamente 13 millones de secuencias de proteínas ("Fondo desconocido / mal anotado"), o alrededor …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.