¿Hay algún libro o tutorial que nos enseñe cómo aplicar eficientemente los algoritmos comunes (clasificación, búsqueda, etc.) en datos grandes (es decir, datos que no se pueden cargar completamente en la memoria principal) y cómo aplicar esos algoritmos de manera eficiente teniendo en cuenta el costo de bloquear la transferencia desde la memoria externa? Por ejemplo, casi todos los libros de texto de algoritmos dicen que los árboles B y B + se pueden usar para almacenar datos en el disco. Sin embargo, en realidad no se explica cómo se puede hacer esto, especialmente el manejo de los punteros donde los datos están presentes en el disco. De manera similar, aunque muchos libros enseñan técnicas de búsqueda, no consideran los datos presentes en la memoria secundaria.
He revisado el libro de Knuth. Aunque discute estas ideas, todavía no entendía cómo aplicarlas en un lenguaje de alto nivel. ¿Hay alguna referencia que discuta estos detalles?