Tengo un archivo html con mucho texto UTF-8 codificado en% en las URL.
Por ejemplo, "% D1% 80% D0% B5% D1% 81% D1% 83% D1% 80% D1% 81% D1% 8B" significa "ресурсы" ("recursos" en ruso).
La tarea es reemplazar todas esas subcadenas con texto legible UTF-8.
Para simplificar la tarea, podemos considerar que no hay otro %
uso de signos en el archivo. Los dígitos de las letras pueden ser mayúsculas y minúsculas.
Sospecho que esto se puede hacer con elegancia sed
, perl
, awk
o algo, pero no saben cómo.
Esta aplicación web parece hacer el truco con el texto que pegas allí.