14
Reemplazar cadena en un enorme (70 GB), una línea, archivo de texto
Tengo un archivo de texto enorme (70 GB), una línea y quiero reemplazar una cadena (token). Quiero reemplazar el token <unk>, con otro token ficticio ( problema de guantes ). Lo intenté sed: sed 's/<unk>/<raw_unk>/g' < corpus.txt > corpus.txt.new ¡pero el archivo de salida corpus.txt.newtiene cero bytes! También intenté usar …