Preguntas etiquetadas con optimization

Use esta etiqueta para cualquier uso de optimización dentro de las estadísticas.

4
¿Por qué los algoritmos de optimización se definen en términos de otros problemas de optimización?
Estoy investigando algunas técnicas de optimización para el aprendizaje automático, pero me sorprende descubrir que un gran número de algoritmos de optimización se definen en términos de otros problemas de optimización. Ilustramos algunos ejemplos a continuación. Por ejemplo https://arxiv.org/pdf/1511.05133v1.pdf Todo se ve bien y bien, pero luego está este en …



3
Descenso coordinado vs gradiente
Me preguntaba cuáles son los diferentes casos de uso para los dos algoritmos, Descenso de coordenadas y Descenso de gradiente . Sé que el descenso coordinado tiene problemas con las funciones no uniformes, pero se usa en algoritmos populares como SVM y LASSO. Sin embargo, creo que el descenso de …


4
¿Cómo asegurar las propiedades de la matriz de covarianza cuando se ajusta el modelo normal multivariado usando la máxima probabilidad?
Supongamos que tengo el siguiente modelo yi=f(xi,θ)+εiyi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i donde yi∈RKyi∈RKy_i\in \mathbb{R}^K , xixix_i es un vector de variables explicativas, θθ\theta es los parámetros de la función no lineal fff y εi∼N(0,Σ)εi∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma) , donde ΣΣ\Sigma naturalmente es K×KK×KK\times K matriz. El objetivo es el habitual para estimar θθ\theta y ΣΣ\Sigma . …

3
¿Por qué la probabilidad máxima y la probabilidad no esperada?
¿Por qué es tan común obtener estimaciones de máxima verosimilitud de parámetros, pero prácticamente nunca se oye hablar de las estimaciones esperadas de parámetros de verosimilitud (es decir, en función del valor esperado en lugar del modo de una función de verosimilitud)? ¿Es esto principalmente por razones históricas, o por …


1
¿Hay alguna explicación intuitiva de por qué la regresión logística no funcionará para un caso de separación perfecta? ¿Y por qué agregar regularización lo arreglará?
Tenemos muchas buenas discusiones sobre la separación perfecta en la regresión logística. Tal como, la regresión logística en R resultó en una separación perfecta (fenómeno de Hauck-Donner). ¿Ahora que? y el modelo de regresión logística no converge . Personalmente, todavía siento que no es intuitivo por qué será un problema …

7
¿Por qué son tan importantes las matrices simétricas positivas definidas (SPD)?
Sé la definición de matriz simétrica positiva definida (SPD), pero quiero entender más. ¿Por qué son tan importantes, intuitivamente? Aquí está lo que sé. ¿Qué más? Para un dato dado, la matriz de covarianza es SPD. La matriz de covarianza es una métrica importante; consulte esta excelente publicación para obtener …

2
En redes neuronales, ¿por qué utilizar métodos de gradiente en lugar de otras metaheurísticas?
En el entrenamiento de redes neuronales profundas y superficiales, ¿por qué los métodos de gradiente (p. Ej., Descenso de gradiente, Nesterov, Newton-Raphson) se usan comúnmente, en oposición a otras metaheurísticas? Por metaheurística me refiero a métodos como el recocido simulado, la optimización de colonias de hormigas, etc., que se desarrollaron …





Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.