¿Hay indicadores claros de que mi archivo de mapa del sitio es beneficioso?


73

Recientemente he creado un archivo sitemap.xml y lo he subido a mi cuenta de Google Webmasters Tools . Google no informó ningún problema o error con el mapa del sitio cargado de mi sitio.

Ahora mi pregunta es:

  • ¿Cómo sé si mi mapa del sitio funciona dentro de las Herramientas para webmasters de Google?

La razón por la que pregunto es que no sé qué se supone que estoy viendo o buscando, y parece que he subido un archivo inútil.

Respuestas:


93

Un archivo de Sitemap ayuda a los motores de búsqueda a descubrir URL nuevas y actualizadas en su sitio web. En particular, si su sitio web es bastante grande, esto puede ayudarlos a poder centrarse en el contenido nuevo y actualizado, en lugar de tener que rastrear ciegamente todo para ver si algo ha cambiado. Eso puede resultar en que el contenido nuevo se encuentre mucho más rápido, lo que puede ser bastante notable, especialmente si el sitio es más grande o más complejo.

Con Google en particular (trabajo en Google; no sé cómo otros motores de búsqueda manejan esto), también hace lo siguiente:

  • Encuentre el número de URL indexadas para su sitio web: estas estadísticas se recalculan diariamente y son muy precisas. Puede encontrarlos en la página de detalles de Sitemaps .
  • Descubra problemas de canonicalización: si los números no coinciden , con frecuencia es una señal de que está especificando URL en el archivo de Sitemap que no coinciden con lo que encontramos durante nuestro rastreo. Esa suele ser una señal de que necesita trabajar en la canonicalización .
  • Ayuda con la canonicalización: cuando encontremos múltiples URL en su sitio que muestren contenido idéntico, le daremos una ventaja adicional a cualquier URL que figure en un Sitemap, incluso si no utiliza otros métodos de canonicalización.
  • Encuentre partes de su sitio mal indexadas: estos recuentos se proporcionan por archivo de Sitemap, para que pueda crear archivos de Sitemap separados para secciones lógicas de su sitio, para descubrir áreas donde Google no está indexando tanto como desea.
  • Priorice los errores de rastreo: en la sección de errores de rastreo , las URL que se especificaron en los archivos de Sitemaps se enumeran por separado. Dado que proporcionó específicamente estas URL, asumimos que desea indexarlas y que cualquier error de rastreo allí es importante.

Además, puede usar varias extensiones en los archivos de Sitemaps (por ejemplo, para imágenes, video, noticias o internacionalización), si decide hacerlo. Estas extensiones son todas opcionales.

Para la mayoría de los sitios web, el elemento más visible de los archivos de Sitemaps es que puede ver el recuento de URL indexado. Puede tardar un día en aparecer, por lo que si acaba de enviar un Sitemap por primera vez, es posible que tenga que ser un poco paciente. Si bien otras formas (por ejemplo, un sitio: -consulta) son aproximaciones muy, muy aproximadas, este recuento es extremadamente exacto.

Editado para agregar: otra cosa que personalmente encuentro extremadamente útil con respecto a Sitemaps es que si no los está generando directamente con su CMS, invariablemente descubre mucho sobre cómo su sitio web se puede rastrear y qué tipo de URL se descubren durante ese proceso He visto muchos casos en los que rastrear un sitio web con una herramienta a su lado (por ejemplo, un generador de Sitemaps) generará problemas que de lo contrario podría perderse, ya sean identificadores de sesión en URL, contenido duplicado a través de diferencias de URL, espacios infinitos (como como calendarios sin fin), o incluso partes de un sitio que no están vinculados en absoluto.


Gran información También he escuchado que con algunos sitios con un alto tráfico de tráfico, es mejor no usar un mapa del sitio porque Google hace un mejor trabajo de rastreo y si falta algo en su mapa del sitio, podría dejar de indexarse.
Chris_O

3
@ Chris_O Estás combinando diferentes problemas juntos. En ese ejemplo, no es que Google esté haciendo un "mejor" trabajo arrastrándose por sí solo; el mapa del sitio en sí es defectuoso. Esa no es una línea directa de argumento para "no usar un mapa del sitio". La solución a esa situación es arreglar el mapa del sitio. Además, los sitemaps son informativos, no directivos. Algo que falta en un mapa del sitio no significa que Google no lo encontrará por sí solo, ni lo ignorará.
Su

El sitio en cuestión tiene más de 40k páginas indexadas y el nuevo contenido se indexa en menos de 5 minutos (sin mapa del sitio). Según su respuesta, comenzaremos a construirlos y los dividiremos en años.
Chris_O

@ john-mueller hola señor. metro. - Una vez que envié un mapa del sitio de prueba con 1000 URL, obtuvimos un recuento de índice de aproximadamente 700, ahora probamos las 1000 URL a través del sitio: www.complete.org/url/to/the/page.html, volvimos un recuento muy por debajo de las 700 URL (más en la región 200). ¿Qué significa esto?
Franz

2
@Franz A veces hay detalles involucrados que dificultan la reproducción del conteo de URL indexadas con el sitio: -consultas. Por ejemplo, hay situaciones en las que podríamos combinar varias URL y solo mostrar una de ellas para un sitio: -consulta. Entonces, si ve una diferencia allí, generalmente no vale la pena preocuparse.
John Mueller

6

Si no recibe ningún error, puede suponer que Google lo ha analizado y conoce el contenido. Pero eso no significa que rastrearán o indexarán esas páginas. Los sitemaps son solo otra forma de informar a los motores de búsqueda acerca de sus páginas. No están obligados a rastrear e indexar ninguna o todas esas páginas. Lo mismo se aplica a encontrar páginas a través de enlaces o envíos de URL.


1
Como información adicional, es bastante fácil ver si Google entiende el mapa del sitio. Verifique en Optimizaciones -> Sitemaps. Le indicará cuántas URL se han enviado en el mapa del sitio. El mapa del sitio leyó con éxito los contenidos y encontró muchos enlaces en él. El segundo número es cuántos se han indexado y, como señala John, depende completamente de Google si encuentran que ninguno, parte o la mayor parte de su contenido vale la pena. Siempre será menor que la cantidad enviada, Google simplemente encuentra que algunas páginas no son tan populares y no se molesta con ellas.
Fiasco Labs

1

Google generalmente hace un buen trabajo al rastrear su sitio web si tiene una buena cantidad de enlaces de calidad. Si pasa mucho tiempo mirando la cantidad de páginas que ha indexado, le sugiero que mejore su sitio y obtenga algunos enlaces de calidad.


0

Tal vez una herramienta de validación de mapa del sitio como esta , aunque nunca he "visto" que el mapa del sitio comience a funcionar.


El archivo ya ha sido validado. Esa no es la pregunta.
Su '27 de

0

Para un sitio web más grande, por ejemplo, un sitio web con cientos, miles o millones de páginas, es bastante útil. Teníamos en nuestro sitio de la empresa 400 000 páginas donde las URL se crearon dinámicamente por ID de contenido y los parámetros de URL se usaron con &, las Herramientas para webmasters de Google le proporcionarán comentarios sobre las páginas rastreadas y le mostrarán errores, puede depurar o abrir la página y mira por ti mismo lo que está mal. De esta manera, Google realmente nos ayudó a hacer un mejor sitio web y nos evitó muchas veces la vergüenza.

También es útil para ver el número de páginas indexadas frente al número de rastreadas.

Para sitios web más pequeños, si el sitio web es un pequeño grupo de páginas .html donde cada página está vinculada a través del menú y el sitio no se actualiza con frecuencia, si carga el mapa del sitio, nada cambiará en los resultados de búsqueda. No tendrá ninguna ventaja de cargar el mapa del sitio sobre alguien que no cargó el mapa del sitio.

También solía tener unos 20 sitios web pequeños, donde tenía mapas de sitio generados por cron script automáticamente y dejé de hacerlo. Un día descubrí que mi error no generó correctamente los archivos XML durante aproximadamente 6 meses, pero afortunadamente Google ignoró mi error e indexó estos sitios web por completo, incluso cuando los mapas del sitio tenían errores, Google usa el mapa del sitio solo como una pista de dónde ir, no muy serio.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.