Tengo un gran archivo ordenado con miles de millones de líneas de longitudes variables. Dada una nueva línea, me gustaría saber qué número de byte obtendría si se hubiera incluido en el archivo ordenado.
Ejemplo
a\n
c\n
d\n
f\n
g\n
Dada la entrada 'foo' obtendría la salida 9.
Esto es fácil de hacer simplemente revisando todo el archivo, pero siendo miles de millones de líneas de longitudes variables, sería más rápido hacer una búsqueda binaria.
¿Ya existe una herramienta de procesamiento de texto?
Editar:
Lo hace ahora: https://gitlab.com/ole.tange/tangetools/blob/master/bsearch/bsearch