No cambiaría nada o aprovecharía la configuración paralela masiva como en Reduceron y su sucesor PilGRIM 1 con una gran pila.
La declaración de que no cambiaría nada parece audaz al principio, pero dado que la CPU es secuencial, existe un proceso de traducción (compilación) que utiliza el hardware disponible en su extensión para mayor eficiencia. Debería haber otra arquitectura, algunas operaciones serían más rápidas, algunas necesitarían trucos de piratería para acelerarlo.
La arquitectura que marcaría la diferencia requeriría la operación del mapa y las listas para ejecutarse más rápido (no toda la historia, pero es suficiente para mostrar el efecto). No existe la posibilidad de crear hardware de cambio dinámico para ejecutar listas de forma nativa, por lo que se almacena en la memoria de ustedes. Nos atenemos a la representación de matriz de alguna forma. Para el mapa, para ejecutar en una configuración no secuencial, volvemos a Reduceron. Así que efectivamente un procesamiento central para instrucciones consecutivas y soporte para procesamiento paralelo.
Lo que podría ser diferente es la posibilidad de cargar múltiples funciones y ejecutarlas sin malabares de cuadros, pero agregar múltiples unidades para funciones crearía un desastre con el acceso a la memoria.
Además de la respuesta de rodillas, el GC sería beneficioso para funcionar como coprocesador, sería una característica muy buena.
1: PilGRIM se describe adecuadamente en Boeijink A., Hölzenspies PKF, Kuper J. (2011) Presentación de PilGRIM: un procesador para ejecutar lenguajes funcionales perezosos. En: Hage J., Morazán MT (eds) Implementación y aplicación de lenguajes funcionales. IFL 2010. Lecture Notes in Computer Science, vol 6647. Springer, Berlín, Heidelberg .