En 2010, ¿publicaría URL que contengan caracteres UTF-8 en un gran portal web?
Los caracteres Unicode están prohibidos según el RFC en las URL (ver aquí ). Tendrían que estar codificados por ciento para cumplir con los estándares.
Sin embargo, mi punto principal es servir los caracteres no codificados con el único propósito de tener URL de aspecto agradable, por lo que la codificación porcentual está desactivada.
Todos los principales navegadores parecen estar analizando esas URL bien, no importa lo que diga el RFC. Sin embargo, mi impresión general es que se vuelve muy inestable al abandonar el dominio de los navegadores web:
- Las URL se copian y se pegan en archivos de texto, correos electrónicos e incluso sitios web con una codificación diferente
- Bibliotecas de cliente HTTP
- Navegadores exóticos, lectores RSS
¿Es correcto mi impresión de que se esperan problemas aquí y, por lo tanto, no es una solución práctica (todavía) si está sirviendo a una audiencia no técnica y es importante que todos sus enlaces funcionen correctamente incluso si se citan y se transmiten?
¿Hay alguna forma mágica de servir URL de aspecto agradable en HTML
http://www.example.com/düsseldorf?neighbourhood=Lörick
que se puede copiar + pegar con los caracteres especiales intactos, pero que funciona correctamente cuando se reutiliza en clientes antiguos?