Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo




3
¿Cuáles son las restricciones de memoria de R?
Al revisar el " Modelo predictivo aplicado ", un revisor declara : Una crítica que tengo de la pedagogía del aprendizaje estadístico (SL) es la ausencia de consideraciones de rendimiento de cómputo en la evaluación de diferentes técnicas de modelado. Con su énfasis en bootstrapping y validación cruzada para ajustar …
10 apache-hadoop  r 

5
Calificaciones para programas de doctorado
Yann LeCun mencionó en su AMA que considera que tener un doctorado es muy importante para conseguir un trabajo en una empresa de primer nivel. Tengo una maestría en estadística y mi licenciatura estaba en economía y matemática aplicada, pero ahora estoy estudiando programas de doctorado de ML. La mayoría …
10 education 



3
¿Cómo codificar una clase con 24,000 categorías?
Actualmente estoy trabajando en un modelo de regresión logística para genómica. Uno de los campos de entrada que quiero incluir como covariable es genes. Hay alrededor de 24,000 genes conocidos. Hay muchas características con este nivel de variabilidad en biología computacional y se necesitan cientos de miles de muestras. Si …



4
¿Se considera PCA un algoritmo de aprendizaje automático?
Comprendí que el análisis de componentes principales es una técnica de reducción de dimensionalidad, es decir, dadas 10 características de entrada, producirá un número menor de características independientes que son la transformación lineal y ortogonal de las características originales. Se PCAconsidera en sí mismo como un algoritmo de aprendizaje o …

2
¿Cómo puedo detectar si una imagen fue retocada?
Me gustaría verificar los archivos JPG si fueron manipulados para cambiar el contenido. Lo que considero NO photoshopped: Recortar Giratorio (Escalada) Resolución de imagen Los cambios automáticos que pueden hacer los teléfonos inteligentes Lo que considero photoshopping: Agregar una nueva imagen encima de partes de la imagen anterior Cambiar el …

2
¿Por qué usar la regularización L1 sobre L2?
Realizando un modelo de regresión lineal usando una función de pérdida, ¿por qué debería usar lugar de L 2 regularización?L1L1L_1L2L2L_2 ¿Es mejor prevenir el sobreajuste? ¿Es determinista (por lo que siempre es una solución única)? ¿Es mejor en la selección de características (porque produce modelos dispersos)? ¿Dispersa los pesos entre …

3
¿Se pueden usar las coordenadas GPS (latitud y longitud) como características en un modelo lineal?
Tengo conjuntos de datos que contienen, entre muchas características, coordenadas GPS (latitud y longitud). Me gustaría utilizar estos conjuntos de datos para explorar problemas como: (1) calcular ETA para conducir entre los puntos de inicio y finalización; y (2) estimar la cantidad de delito para un punto específico. Me gustaría …

1
Número y tamaño de capas densas en una CNN
La mayoría de las redes que he visto tienen una o dos capas densas antes de la capa final de softmax. ¿Hay alguna forma de principios de elegir el número y el tamaño de las capas densas? ¿Son dos capas densas más representativas que una para el mismo número de …
10 convnet 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.