Múltiples métodos de aprendizaje del núcleo tienen como objetivo construir un modelo de núcleo donde el núcleo es una combinación lineal de núcleos de base fija. Aprender el núcleo consiste en aprender los coeficientes de ponderación para cada núcleo base, en lugar de optimizar los parámetros del núcleo de un solo núcleo.
Las desventajas del aprendizaje de múltiples núcleos parecen ser que son menos interpretables y computacionalmente costosas (para evaluar el resultado del modelo es necesario evaluar todos los núcleos base). Entonces, si se puede lograr un rendimiento similar simplemente optimizando un solo núcleo, ¿cuáles son las ventajas de MKL?