¿El teorema de Mercer funciona a la inversa?
No en todos los casos.
Wikipedia: "En matemáticas, específicamente en el análisis funcional, el teorema de Mercer es una representación de una función simétrica positiva definida en un cuadrado como la suma de una secuencia convergente de funciones de producto. Este teorema, presentado en (Mercer 1909), es uno de los resultados más notables del trabajo de James Mercer. Es una herramienta teórica importante en la teoría de ecuaciones integrales; se usa en la teoría espacial de Hilbert de procesos estocásticos, por ejemplo el teorema de Karhunen-Loève; y también se usa para caracterizar un núcleo simétrico positivo semi-definido.
Es un ' mapeo de muchos a uno ' en un espacio de Hilbert . - un bruto simplificación sería describirlo como un hash o suma de comprobación que se puede probar en contra de un archivo para determinar la identidad o no.
Explicación más técnica: teorema de desintegración
"En matemáticas, el teorema de la desintegración es el resultado de la teoría de la medida y la teoría de la probabilidad. Define rigurosamente la idea de una " restricción "no trivial de una medida a un subconjunto de medida cero del espacio de medida en cuestión. Está relacionado con el existencia de medidas de probabilidad condicional. En cierto sentido, "desintegración" es el proceso opuesto a la construcción de una medida de producto ".
Ver también: " El teorema de Fubini-Tonelli ", " Pérdida de bisagra ", " Función de pérdida " y " ¿Qué tan bueno es un núcleo cuando se usa como medida de similitud? " (Junio de 2007) por Nathan Srebro, el resumen:
" Resumen. Recientemente, Balcan y Blum sugirieron una teoría del aprendizaje basada en funciones de similitud generales, en lugar de núcleos positivos semi-definidos. Estudiamos la brecha entre las garantías de aprendizaje basadas en el aprendizaje basado en el núcleo y las que pueden obtenerse utilizando el núcleo como una función de similitud, que fue dejada abierta por Balcan y Blum. Proporcionamos un límite significativamente mejorado sobre cuán buena es una función del núcleo cuando se usa como una función de similitud, y ampliamos el resultado también a la pérdida de bisagra más relevante en la práctica. luego tasa de error cero uno. Además, mostramos que este límite es estrecho y, por lo tanto, establecemos que de hecho existe una brecha real entre la noción tradicional de margen basada en el núcleo y la noción más reciente basada en la similitud ".
s
Ver: granos y similitud (en R)
Es un recuadro negro, por lo que no sabe con certeza qué kernel se utiliza, si está basado en el kernel, y no conoce los detalles de la implementación del kernel una vez que cree saber cuál es. Ver: ¿La ecuación de rbfKernel en kernlab es diferente del estándar? .
Por otro lado, esto suena un poco loco.
Es rápido y efectivo, bajo un conjunto restringido de circunstancias. Como un martillo, si llevas un martillo, ¿la gente te llamará loco?
"Los métodos del núcleo deben su nombre al uso de las funciones del núcleo, que les permiten operar en un espacio de características implícitas de alta dimensión sin calcular las coordenadas de los datos en ese espacio, sino simplemente calculando los productos internos entre las imágenes de todos los pares de datos en el espacio de características. Esta operación es a menudo computacionalmente más barata que el cálculo explícito de las coordenadas. Este enfoque se llama "truco del núcleo". Se han introducido funciones del núcleo para datos de secuencia, gráficos, texto, imágenes, como bien como vectores ".
Lección: Usted (a veces) obtiene lo que paga.
ff(s(a,b))=d(a,b)dsf
Muchos, vea los enlaces anteriores, " Funciones populares del núcleo ", RBF , y aquí hay un ejemplo (costoso): " Una medida de distancia de relación de probabilidad para la similitud entre la serie de transformadas de Fourier " (2005), por Janacek, Bagnall y Powell.
Si f no existe en estas circunstancias generales en s , ¿existe un conjunto adicional de requisitos para los cuales existe ffsf
Los diferentes espacios y métodos pueden orientar mejor la comparación (y la desintegración) de problemas específicos, existen muchos métodos solo para el espacio de Hilbert .
Sí, la lista es grande, vea los enlaces de arriba y (por ejemplo): reproducción del espacio de Hilbert del núcleo .