He estado estudiando este tema durante varios días y he encontrado muchas sugerencias contradictorias con respecto a la indexación de búsqueda. Estoy trabajando en un proyecto que tiene muchas páginas diferentes que van desde simples descripciones de productos hasta documentación detallada para el usuario.
He dividido esta pregunta en secciones ya que creo que esto la hará más útil para futuros lectores de esta pregunta.
Algunos de mis hallazgos
Varios sitios web parecen haber asumido esquemas de documentos como los siguientes:
1. Programmer's Guide (https://www.dartlang.org/docs/)
1. Getting Started
2. Concepts
1. Libraries
2. Fundamental classes
etc.
Me parece interesante que el ejemplo anterior no utiliza el <nav>
elemento con un encabezado adecuado. Me gusta la simplicidad del esquema y al ser Google, estoy bastante seguro de que saben lo que están haciendo cuando se trata de esto.
Pero estoy confundido ya que el esquema anterior no menciona "Dart". La única mención de "Dart" en el sentido semántico parece estar dentro del <title>
elemento principal del documento "Guía del programador | Dart: Aplicaciones web estructuradas".
El MDN (Mozilla Developer Network) es otro brillante ejemplo de un sitio web que sigue este principio. Muchos de los <h1>
títulos proporcionan un contexto completo ( Secciones y esquemas de un documento HTML5 ):
1. Sections and Outlines of an HTML5 Document
1. Untitled Section (nav)
2. Untitled Section (nav)
3. Structure of a Document in HTML 4
4. Problems Solved by HTML5
Mientras que otros no tienen mucho sentido fuera de contexto ( prácticas obsoletas para evitar ). Por ejemplo, el siguiente esquema HTML5 se relaciona con CSS, HTML5 o C # ... con solo el esquema del documento, ¡quién sabe!
1. Obsolete practices to avoid
1. Untitled Section (nav)
2. Untitled Section (nav)
3. Doctype
4. <meta> element and charset attribute
Para empeorar las cosas, ¿qué pasaría si el MDN contuviera 2 temas con el mismo título (o muy similar) "Prácticas obsoletas para evitar", donde uno es parte de su guía CSS y el otro es parte de su guía HTML ...
En el otro extremo del espectro, los sitios web parecen usar el <body>
encabezado de nivel principal para el nombre del producto (Foo) o el contenedor del tema (Guía del usuario para Foo). Donde todas las páginas posteriores se usan <h2>
para el título de la página real.
La pregunta
¿Cómo infieren los motores de búsqueda el contexto de una página web como las que se encuentran en el sitio web de MDN utilizando el DOM y el esquema HTML5?
¿Cuál es la forma correcta de marcar la siguiente página HTML5 para que Google pueda indexar la página en el contexto adecuado? Esto incluye el uso de <title>
, <header>
y <h1>
elementos.
- nombre de empresa
- nombre del producto
- Guía del usuario
- Empezando
El encabezado más significativo en el HTML que se visualiza en un navegador web, si representa el contexto de todo el sitio web (Nombre de la empresa o Nombre del producto), la colección de temas (Guía del usuario) o el tema real en cuestión (Primeros pasos) ?
Mi mejor conjetura
<!DOCTYPE html>
<html>
<head>
<title>Getting Started | User Guide | Product Name - Company Name</title>
</head>
<body>
<header role="banner"> <!-- Note: Lack of <h1> in here -->
<a id="logo" href="http://example.com">Company Name</a>
<nav>
<h1>Site Navigation</h1>
<ul> ... </ul>
</nav>
</header>
<main role="main">
<div class="product-name">Product Name</div>
<div class="document">User Guide</div>
<h1>Getting Started</h1>
<p>blah</p>
</main>
</body>
</html>
Conduciendo al bosquejo:
1. Getting Started
<title>
proporcionar contexto. Por ejemplo, es una mala idea incluir lo mismo <h1>User Guide for Ubermachine</h1>
en cada página donde se presenta el encabezado del tema <h2>Getting Started</h2>
... o si el esquema comienza <h1>Getting Started</h1>
con un acompañamiento <title>Getting Started | User Guide for Ubermachine</title>
para proporcionar un contexto útil para los motores de búsqueda. Esta es una pregunta de SEO.
<title>
proporciona suficiente contexto.