Esta es una pregunta interesante, sin embargo, carece de una aclaración adecuada de lo que se considera una red neuronal convolucional .
¿Es el único requisito que la red tiene que incluir una operación de convolución? ¿Tiene que incluir solo operaciones de convolución? ¿Se admiten las operaciones de agrupación? Las redes convolucionales utilizadas en la práctica utilizan una combinación de operaciones, que a menudo incluyen capas completamente conectadas (tan pronto como tenga capas completamente conectadas, tendrá la capacidad teórica de aproximación universal).
Para proporcionarle alguna respuesta, considere el siguiente caso: una capa completamente conectada con entradas y salidas se realiza utilizando una matriz de peso . Puede simular esta operación utilizando 2 capas de convolución:DKW∈RK×D
La primera de ellas tiene los filtros de la forma . Elemento del filtro es igual a , el resto son ceros. Esta capa transforma la entrada en espacio intermedio dimensional donde cada dimensión representa un producto de un peso y su entrada correspondiente.K×DDdk,dWk,dKD
La segunda capa contiene filtros de forma . Los elementos del filtro son unos, el resto son ceros. Esta capa realiza la suma de productos de la capa anterior.KKDkD…(k+1)Dk
Dicha red convolucional simula una red totalmente conectada y, por lo tanto, tiene las mismas capacidades de aproximación universal. Depende de usted considerar cuán útil es este ejemplo en la práctica, pero espero que responda su pregunta.