Preguntas etiquetadas con machine-learning

Los algoritmos de aprendizaje automático crean un modelo de los datos de entrenamiento. El término "aprendizaje automático" está vagamente definido; incluye lo que también se llama aprendizaje estadístico, aprendizaje de refuerzo, aprendizaje no supervisado, etc. AGREGUE SIEMPRE UNA ETIQUETA MÁS ESPECÍFICA.









1
Algoritmos de incrustación de palabras en términos de rendimiento
Estoy tratando de incrustar aproximadamente 60 millones de frases en un espacio vectorial , luego calcular la similitud de coseno entre ellas. He estado usando sklearn's CountVectorizercon una función de tokenizador personalizada que produce unigramas y bigrams. Resulta que para obtener representaciones significativas, tengo que permitir un gran número de …



2
¿Cuáles son las diferencias entre la regresión de Ridge usando el glmnet de R y el scikit-learn de Python?
Estoy revisando la sección LAB §6.6 sobre Regresión de cresta / lazo en el libro 'Una introducción al aprendizaje estadístico con aplicaciones en R' de James, Witten, Hastie, Tibshirani (2013). Más específicamente, estoy tratando de aplicar el Ridgemodelo scikit-learn al conjunto de datos 'Hitters' del paquete R 'ISLR'. He creado …

1
umbral de cálculo para el clasificador de riesgo mínimo?
Suponga que dos clases y tienen un atributo tienen distribución y . si tenemos igual para la siguiente matriz de costos:C1C1C_1C2C2C_2xxxN(0,0.5)N(0,0.5) \cal{N} (0, 0.5)N(1,0.5)N(1,0.5) \cal{N} (1, 0.5)P(C1)=P(C2)=0.5P(C1)=P(C2)=0.5P(C_1)=P(C_2)=0.5 L=[010.50]L=[00.510]L= \begin{bmatrix} 0 & 0.5 \\ 1 & 0 \end{bmatrix} ¿Por qué, es el umbral para el clasificador de riesgo mínimo (costo)?x0&lt;0.5x0&lt;0.5x_0 < …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.