Otra razón para ir con el corto es que coincide con otras instancias en las que puede especificar un conjunto de caracteres en el marcado. Por ejemplo:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
La consistencia ayuda a reducir los errores y hacer que el código sea más legible.
Tenga en cuenta que el atributo charset no distingue entre mayúsculas y minúsculas. Puede usar UTF-8 o utf-8, sin embargo, UTF-8 es más claro, más legible y más preciso.
Además, no hay absolutamente ninguna razón para usar cualquier valor que no sea UTF-8 en el atributo meta charset o encabezado de página. UTF-8 es la codificación predeterminada para documentos web desde HTML4 en 1999 y la única forma práctica de crear páginas web modernas.
Tampoco debe usar entidades HTML en UTF-8. Los caracteres como el símbolo de copyright deben escribirse directamente. Las únicas entidades que debe usar son para los 5 caracteres de marcado reservados: menor que, mayor que, ampersand, prime, double prime. Las entidades necesitan un analizador HTML, que no siempre querrá usar en el futuro, introducen errores, hacen que su código sea menos legible, aumentan el tamaño de sus archivos y, a veces, decodifican incorrectamente en varios navegadores dependiendo de las entidades que haya utilizado. Aprenda cómo escribir / insertar derechos de autor, marca registrada, comillas abiertas, comillas cerradas, apóstrofo, em dash, en dash, viñeta, euro y cualquier otro carácter que encuentre en su contenido, y use esos caracteres reales en su código. La Mac tiene un Visor de caracteres que puede activar en la Preferencia del sistema del teclado, y puede buscar y luego arrastrar y soltar los caracteres que necesita, o usar el Visor de teclado correspondiente para ver qué teclas escribir. Por ejemplo, la marca registrada es la Opción + 2. UTF-8 contiene todos los caracteres y símbolos de cada lenguaje humano escrito. Por lo tanto, no hay excusa para usar, en lugar de un guión em. No es una mala idea aprender las reglas de puntuación y tipografía también ... por ejemplo, sabiendo que un punto va dentro de una cita cerrada, no afuera.
Usar una etiqueta para algo como tipo de contenido y codificación es muy irónico, ya que sin saber esas cosas, no se podría analizar el archivo para obtener el valor de la metaetiqueta.
No, eso no es verdad. El navegador comienza a analizar el archivo como la codificación predeterminada del navegador, ya sea UTF-8 o ISO-8859-1. Dado que US-ASCII es un subconjunto de ISO-8859-1 y UTF-8, el navegador puede leer bien de cualquier manera ... es lo mismo. Cuando el navegador encuentra la etiqueta meta charset, si la codificación es diferente de lo que el navegador ya está usando, el navegador vuelve a cargar la página en la codificación especificada. Es por eso que colocamos la etiqueta meta charset en la parte superior, justo después de la etiqueta head, antes que nada, incluso el título. De esa manera puede usar caracteres UTF-8 en su título.
Debe guardar su archivo (s) en codificación UTF-8 sin BOM
Eso no es estrictamente cierto. Si solo tiene caracteres US-ASCII en su documento, puede guardarlo como US-ASCII y servirlo como UTF-8, porque es un subconjunto. Pero si hay caracteres Unicode, está en lo correcto, debe Guardar como UTF-8 sin BOM.
Si desea un buen editor de texto que guarde sus archivos en UTF-8, le recomiendo Notepad ++.
En Mac, use Bare Bones TextWrangler (gratis) de Mac App Store, o Bare Bones BBEdit que está en Mac App Store por $ 39.99 ... muy barato para una herramienta tan genial. En cualquiera de las aplicaciones, hay un menú en la parte inferior de la ventana del documento donde puede especificar la codificación del documento y puede elegir fácilmente "UTF-8 sin BOM". Y, por supuesto, puede configurarlo como predeterminado para los nuevos documentos en Preferencias.
Pero si su servidor web sirve la codificación en el encabezado HTTP, lo cual se recomienda, ambas [metaetiquetas] son innecesarias.
Eso es incorrecto. Por supuesto, debe establecer la codificación en el encabezado HTTP, pero también debe establecerla en el atributo meta charset para que el usuario pueda guardar la página, salir del navegador en el almacenamiento local y luego abrirla nuevamente más tarde, en cuyo caso La única indicación de la codificación que estará presente es el atributo meta charset. También debe establecer una etiqueta base por la misma razón ... en el servidor, la etiqueta base no es necesaria, pero cuando se abre desde el almacenamiento local, la etiqueta base permite que la página funcione como si estuviera en el servidor, con todos los activos en su lugar, etc., sin enlaces rotos.
AddDefaultCharset UTF-8
O simplemente puede cambiar la codificación de tipos de archivos particulares de esta manera:
AddType text/html;charset=utf-8 html
Un consejo para servir los archivos UTF-8 y Latin-1 (ISO-8859-1) es dar a los archivos UTF-8 una extensión de "texto" y los archivos Latin-1 "txt".
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
Finalmente, considere Guardar sus documentos con terminaciones de línea Unix, no con terminaciones de línea DOS o Mac (clásicas) heredadas, que no ayudan y pueden dañar, especialmente a medida que avanzamos más y más de esos sistemas heredados. Un documento HTML con HTML5 válido, codificación UTF-8 y terminaciones de línea Unix es un trabajo bien hecho. Puede compartir, editar, almacenar, leer, recuperar y confiar en ese documento en muchos contextos. Es lingua franca. Es papel digital.