Respuestas:
Sugeriría la siguiente guía teórica. Cuando utiliza el núcleo Gaussian RBF, su superficie de separación se basará en una combinación de superficies en forma de campana centradas en cada vector de soporte. El ancho de cada superficie en forma de campana será inversamente proporcional a . Si este ancho es menor que la distancia mínima por pares para sus datos, esencialmente tiene un sobreajuste. Si este ancho es mayor que la distancia máxima por pares para sus datos, todos sus puntos caen en una clase y tampoco tiene un buen rendimiento. Entonces, el ancho óptimo debe estar en algún lugar entre estos dos extremos.
No, es esencialmente dependiente de los datos. La búsqueda de cuadrícula (sobre hiperparámetros transformados logarítmicamente) es un método muy bueno si solo tiene un pequeño número de hiperparámetros para ajustar, pero no haga que la resolución de la cuadrícula sea demasiado fina o es probable que ajuste demasiado la afinación criterio. Para problemas con una mayor cantidad de parámetros del núcleo, encuentro que el método simplex de Nelder-Mead funciona bien.
pair-wise distance for your data
= distancia euclidiana simple después de escalar?