¿Hay una forma sencilla de imprimir todos los caracteres no ASCII y los números de línea en el que ocurren en un archivo mediante una utilidad de línea de comandos como grep
, awk
, perl
, etc?
Quiero cambiar la codificación de un archivo de texto de UTF-8 a ASCII, pero antes de hacerlo, deseo reemplazar manualmente todas las instancias de caracteres no ASCII para evitar cambios inesperados de caracteres efectuados por la rutina de conversión de archivos.
LC_ALL=C grep -n -P [$'\x80'-$'\xFF']
donde el primer bit desactiva la intercalación.