Aquí está el extracto del programa en cuestión. La matriz img[][]
tiene el tamaño SIZE × SIZE, y se inicializa en:
img[j][i] = 2 * j + i
Luego, haces una matriz res[][]
, y cada campo aquí está hecho para ser el promedio de los 9 campos a su alrededor en la matriz img. El borde se deja en 0 por simplicidad.
for(i=1;i<SIZE-1;i++)
for(j=1;j<SIZE-1;j++) {
res[j][i]=0;
for(k=-1;k<2;k++)
for(l=-1;l<2;l++)
res[j][i] += img[j+l][i+k];
res[j][i] /= 9;
}
Eso es todo lo que hay en el programa. Para completar, esto es lo que viene antes. Ningún código viene después. Como puede ver, es solo inicialización.
#define SIZE 8192
float img[SIZE][SIZE]; // input image
float res[SIZE][SIZE]; //result of mean filter
int i,j,k,l;
for(i=0;i<SIZE;i++)
for(j=0;j<SIZE;j++)
img[j][i] = (2*j+i)%8196;
Básicamente, este programa es lento cuando SIZE es un múltiplo de 2048, por ejemplo, los tiempos de ejecución:
SIZE = 8191: 3.44 secs
SIZE = 8192: 7.20 secs
SIZE = 8193: 3.18 secs
El compilador es GCC. Por lo que sé, esto se debe a la gestión de la memoria, pero realmente no sé demasiado sobre ese tema, por lo que pregunto aquí.
Además, cómo solucionar esto sería bueno, pero si alguien pudiera explicar estos tiempos de ejecución, ya estaría lo suficientemente feliz.
Ya conozco malloc / free, pero el problema no es la cantidad de memoria utilizada, es simplemente el tiempo de ejecución, por lo que no sé cómo ayudaría eso.