Estoy usando modelos SVM para hacer pronósticos a corto plazo de contaminantes del aire. Para entrenar un nuevo modelo, necesito encontrar metaparámetros apropiados para un modelo SVM (me refiero a C, gamma, etc.).
La documentación de Libsvm (y muchos otros libros que he leído) sugiere usar la búsqueda de cuadrícula para encontrar estos parámetros, por lo que básicamente entreno el modelo para cada combinación de estos parámetros de un conjunto determinado y elijo el mejor modelo.
¿Hay alguna forma mejor de encontrar metaparámetros óptimos (o casi óptimos)? Para mí es principalmente una cuestión de tiempo de cálculo: una búsqueda en cuadrícula de este problema lleva aproximadamente dos horas (después de hacer algunas optimizaciones).
Ventajas de la búsqueda en la cuadrícula:
- Se puede paralelizar fácilmente: si tiene 20 CPU, se ejecutará 20 veces más rápido, paralelizar otros métodos es más difícil
- Verifica grandes partes del espacio de metaparámetros, por lo que si hay una buena solución, la encontrará.