He estado usando GNU SED por un par de años. Me da vueltas un poco a veces, pero hace un buen trabajo ... ¡para conjuntos de caracteres de un solo byte!
De vez en cuando noto que las referencias a GNU SED son compatibles con Unicode, pero lo más cercano que he visto de esto es su modo "binario" ... y el binario no es Unicode.
¿Puede GSED procesar un archivo de texto Unicode con resolución de CodePoint, incluyendo y especialmente \ r \ n (Windows) ... y si puede, ¿espera UTF-8, UTF-16 o qué? ¿Y cómo detecta SED la codificación?