Escuché mucho esta pregunta de la entrevista y esperaba obtener algunas opiniones sobre cuáles podrían ser buenas respuestas: tiene un archivo grande de más de 10 GB y desea saber qué elemento se produce más, cuál es una buena manera ¿para hacer esto?
Iterar y realizar un seguimiento en un mapa probablemente no sea una buena idea, ya que usa mucha memoria, y realizar un seguimiento a medida que ingresan las entradas no es la mejor opción, ya que cuando se plantea esta pregunta, el archivo generalmente ya existe.
Otros pensamientos que incluí dividir el archivo para ser iterado y procesado por múltiples subprocesos y luego combinar esos resultados, pero el problema de memoria para los mapas sigue ahí.