RFC 3066 proporciona los detalles de los valores permitidos (énfasis y enlaces agregados):
Todas las subetiquetas de 2 letras se interpretan como códigos de país ISO 3166 alfa-2 de [ISO 3166] , o posteriormente asignados por la agencia de mantenimiento ISO 3166 o los organismos reguladores de normalización, indicando el área a la que se refiere esta variante de lenguaje.
Interpreto que significa que cualquier código de 2 letras válido (según ISO 3166) es válido como subetiqueta. El RFC continúa diciendo:
Las etiquetas con segundas subetiquetas de 3 a 8 letras pueden registrarse en IANA, de acuerdo con las reglas del capítulo 5 de este documento.
Por cierto, parece un error tipográfico, ya que el capítulo 3 parece estar relacionado con el proceso de registro, no con el capítulo 5.
Una búsqueda rápida del registro de la IANA revela una lista muy larga de todas las subetiquetas de idioma disponibles. Aquí hay un ejemplo de la lista (que se usaría como en-scouse
):
Tipo: variante
Subetiqueta: scouse
Descripción: Scouse
Agregado: 2006-09-18
Prefijo: en
Comentarios: dialecto de Liverpool en inglés conocido como 'Scouse'
Hay todo tipo de subetiquetas disponibles; ya ha revelado un rápido rollo fr-1694acad
(francés del siglo XVII).
La utilidad de algunas de estas etiquetas (yo diría que la gran mayoría), cuando se trata de documentos diseñados para mostrarse en el navegador, es limitada. La especificación de internacionalización del W3C simplemente establece:
Los navegadores y otras aplicaciones pueden usar información sobre el idioma del contenido para entregar a los usuarios la información más apropiada o para presentar información a los usuarios de la manera más apropiada. Cuanto más contenido esté etiquetado y etiquetado correctamente, más útiles y omnipresentes serán dichas aplicaciones.
Estoy luchando por encontrar información detallada sobre cómo se comportan los navegadores cuando se encuentran con etiquetas de diferentes idiomas, pero lo más probable es que ofrezcan algún beneficio a los usuarios que usan un lector de pantalla, que puede usar la etiqueta para determinar el idioma / dialecto / acento. en el que presentar el contenido.