Estoy trabajando en un sitio web que ofrecerá contenido localizado siguiendo el language+region
enfoque descrito en esta página de W3.org (por ejemplo, fr-CA
para contenido en francés canadiense y fr-FR
para contenido en "francés francés"). Dado que consideramos que el contenido de cada uno language+region
es único, es crucial para nosotros que los motores de búsqueda identifiquen y sirvan el contenido de manera adecuada.
Al buscar en Internet (por ejemplo, esta pregunta ), parece que la mayoría de las personas recomiendan el uso de un código de idioma ISO639 en el lang
atributo HTML para describir el idioma del contenido. Siguiendo esta recomendación, terminaríamos usando <html lang="fr">
lo que no permitiría la diferenciación entre las language+region
combinaciones antes mencionadas .
Al revisar la especificación HTML4 , parece que usarlo language+region
como código de idioma estaría perfectamente bien, ya que el en-US
ejemplo se da como un valor posible. Sin embargo, no pude encontrar ninguna confirmación de esto en la especificación HTML5 que no parece proporcionar ningún ejemplo en cuanto a los posibles valores permitidos.
A partir de ahí, intenté obtener una respuesta de facto mirando lo que están haciendo los gigantes de la web. Observé lo que Facebook está haciendo: ofrecen versiones de sus sitios web en francés franco y francés con contenido (ligeramente) diferente, mientras que el lang
valor HTML sigue siendo el mismo:
fr-CA
URL: http://fr-ca.facebook.com
HTML lang atributo: <html lang="fr">
traducción de la palabra 'correo electrónico':courriel
fr-FR
URL: http://fr-fr.facebook.com/
HTML lang atributo: <html lang="fr">
traducción de la palabra 'correo electrónico':Adresse électronique
¿Cuál es la forma recomendada / estándar de describir el contenido que se localizó utilizando el language+region
enfoque en HTML5?