Páginas canónicas en el subdominio que aparecen en los resultados de búsqueda de Google


8

Es posible que hayas escuchado que lanzamos Facebook Stack Overflow ayer.

Como parte de esto, modificamos nuestro código para poner <meta rel="canonical" ...etiquetas en cada pregunta y usuario en el dominio facebook.stackoverflow.com que apunta al desbordamiento de pila "vanilla".

Por ejemplo:

Error de iAd "Inventario de anuncios no disponible" en facebook.stackoverflow.com
y
error de iAd "Inventario de anuncios no disponible" en stackoverflow.com

En facebook.stackoverflow, el html contiene la metaetiqueta

<link rel="canonical" href="/programming/3720459/iad-error-ad-inventory-unavailable">

La intención es decirle a Google "estas son exactamente la misma página, impartir todo el rango de páginas a la copia de Stack Overflow y preferirla en los resultados de búsqueda".

Este parece ser el punto de rel = "canonical" .

Una página canónica es la versión preferida de un conjunto de páginas con contenido muy similar.

Es común que un sitio tenga varias páginas que enumeren el mismo conjunto de productos. Por ejemplo, una página puede mostrar productos ordenados alfabéticamente, mientras que otras páginas muestran los mismos productos enumerados por precio o por clasificación. Por ejemplo:

Si Google sabe que estas páginas tienen el mismo contenido, podemos indexar solo una versión para nuestros resultados de búsqueda. Nuestros algoritmos seleccionan la página que creemos que responde mejor a la consulta del usuario. Ahora, sin embargo, los usuarios pueden especificar una página canónica para los motores de búsqueda agregando un elemento con el atributo rel = "canonical" a la sección de la versión no canónica de la página. Agregar este enlace y atributo permite a los propietarios de sitios identificar conjuntos de contenido idéntico y sugerir a Google: "De todas estas páginas con contenido idéntico, esta página es la más útil. Por favor, priorícela en los resultados de búsqueda".

Sin embargo, estamos viendo resultados de desbordamiento de pila de Facebook y, a veces, incluso superan el desbordamiento de pila de vainilla ( un ejemplo ). ¿Quizás esto tiene algo que ver con tener un sitemap.xml independiente para facebook.stackoverflow.com (una especie de toma en la oscuridad)?

ejemplo de resultado de búsqueda de Google

Entonces, ¿qué estamos haciendo mal aquí?

Esperamos mantener funcionando las búsquedas del formulario site:facebook.stackoverflow.com, pero abandonarlas es totalmente aceptable si rel="noindex"se requiere un total .

Respuestas:


4

Según la misma página a la que se vinculó rel="canonical" es solo una sugerencia y no una directiva:

¿Es rel = "canonical" una sugerencia o una directiva?

Esta nueva opción permite a los propietarios de sitios sugerir la versión de una página que Google debería tratar como canónica. Google tendrá esto en cuenta, junto con otras señales, al determinar qué conjuntos de URL contienen contenido idéntico y al calcular las páginas más relevantes para mostrar en los resultados de búsqueda.

Es posible que Google simplemente haya elegido ignorar la URL canónica o que aún no haya actuado sobre ella.

Pero la razón por la que supera la pregunta de StackOverflow es probablemente simple: (suponiendo que Google ignore la rel="canonical"directiva) el subdominio de Facebook tiene "facebook" en la URL, lo que tiene bastante peso en el algoritmo de clasificación de Google.


Esperábamos canonicalcompensar eso ... Supongo que no. El problema relacionado con los resultados de FB.SO que aparecen en una página incluso sin un término de búsqueda de Facebook ( ejemplo ) parece que Google simplemente ignora la sugerencia.
Kevin Montrose

1
Google parecía trabajar con SO en el problema del contenido duplicado en el que otros sitios superaban a SO por el contenido original de SO. Me pregunto si también investigarían esto para SO.
John Conde

3

Veo que este problema se está solucionando ahora. Puede probar haciendo una información: consulta en Google como esta que muestra la nueva URL.

Resultado de google para facebook.stackoverflow.com/q/3720459

Lo que pasa con la etiqueta canónica es que es una directiva, lo que significa que no funciona el 100% del tiempo. Las redirecciones 301 son las mismas: no siempre pasan el 100% del peso a través de la redirección.

Además, con cualquiera de ellos, Google tarda unas semanas en comprender que están allí para quedarse y deben seguirse. Este es un problema con las páginas nuevas porque se activan y estarán en la URL incorrecta durante unos días / semanas antes de que Google siga el canónico.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.