Es porque es más fácil y más barato aumentar el ancho de banda de la DRAM que disminuir la latencia. Para obtener los datos de una fila abierta de ram, es necesaria una cantidad de trabajo no trivial.
La dirección de la columna debe decodificarse, los muxes que seleccionan a qué líneas acceder deben controlarse, y los datos deben moverse a través del chip hacia las memorias intermedias de salida. Esto lleva un poco de tiempo, especialmente dado que los chips SDRAM se fabrican en un proceso adaptado a altas densidades de ram y no a altas velocidades lógicas. Para aumentar el ancho de banda, por ejemplo, mediante el uso de DDR (1,2,3 o 4), la mayor parte de la lógica puede ampliarse o canalizarse, y puede operar a la misma velocidad que en la generación anterior. Lo único que debe ser más rápido es el controlador de E / S para los pines DDR.
Por el contrario, para disminuir la latencia, se debe acelerar toda la operación, lo cual es mucho más difícil. Lo más probable es que las partes del ram deberían hacerse en un proceso similar al de las CPU de alta velocidad, lo que aumenta el costo sustancialmente (el proceso de alta velocidad es más costoso, además cada chip debe pasar por 2 procesos diferentes).
Si compara las memorias caché de la CPU con la RAM y el disco duro / SSD, existe una relación inversa entre el almacenamiento es grande y el almacenamiento es rápido. Un L1 $ es muy rápido, pero solo puede contener entre 32 y 256kB de datos. La razón por la que es tan rápido es porque es pequeño:
- Se puede colocar muy cerca de la CPU usándola, lo que significa que los datos tienen que viajar una distancia más corta para llegar a ella.
- Los cables en él se pueden acortar, lo que significa que los datos tardan menos tiempo en atravesarlo.
- No ocupa mucho área o muchos transistores, por lo que no es tan costoso hacerlo en un proceso de velocidad optimizada y usar mucha potencia por bit almacenado
A medida que avanza en la jerarquía, cada opción de almacenamiento aumenta en capacidad, pero también en área y más lejos del dispositivo que lo usa, lo que significa que el dispositivo debe ser más lento.