Estoy eliminando palabras vacías de un texto, aproximadamente usando este código
Tengo lo siguiente
$ cat file
file
types
extensions
$ cat stopwords
i
file
types
grep -vwFf stopwords file
Estoy esperando el resultado:
extensions
pero me sale el (creo que incorrecto)
file
extensions
Es como si la palabra filese hubiera omitido en el archivo de palabras clave. Ahora aquí está la parte fría: si modifica el archivo de palabras vacías, cambiando la palabra / carta ien la primera línea, a cualquier otra letra ASCII, aparte de f, i, l, e, a continuación, el mismo comando grep me da un resultado diferente y correcta de extensions.
¿Qué está pasando aquí y cómo lo soluciono?
Estoy usando grep (BSD grep) 2.5.1-FreeBSD en un Mac OSX GNU bash, versión 4.4.12 (1)
ipatrón en el segundo patrón en lugar del primer patrón en el stopwordsarchivo también altera el comportamiento.
grepni con GNU grep3.1.
-xinterruptor para regex de línea en lugar de-wpara word? Sin embargo, creo que el-Finterruptor cancelará cualquiera de ellos, o viceversa.