La guía para webmasters Contenido duplicado de Google define el contenido duplicado (para fines de optimización de motores de búsqueda) como "bloques sustantivos de contenido dentro o entre dominios que coinciden completamente con otro contenido o son apreciablemente similares".
La guía de Google enumera lo siguiente como ejemplos de contenido duplicado:
- Foros de discusión que pueden generar páginas regulares y despojadas dirigidas a dispositivos móviles
- Almacenar elementos mostrados o vinculados a través de múltiples URL distintas
- Versiones de páginas web solo para impresoras
Sanciones
Los motores de búsqueda deben penalizar algunas instancias de contenido duplicado que están diseñadas para enviar spam a su índice de búsqueda, tales como:
- sitios de raspadores que copian contenido al por mayor
- técnicas simplistas de hilado de artículos que generan contenido "nuevo" al reemplazar selectivamente las palabras en el contenido existente.
Cuando los motores de búsqueda encuentran contenido duplicado, pueden:
- Penalizar un sitio completo que contiene contenido duplicado. (cuando es spam)
- Elija una página como fuente canónica del contenido y reduzca la prioridad o no indexe la otra página con la duplicación. (común)
- No realice acciones punitivas e indexe varias copias del contenido (raro)
Evitar la duplicación interna
Cuando se le preguntó sobre el contenido duplicado, Matt Cutts de Google dijo que solo debería lastimarlo si parece spam , sin embargo, muchos webmasters emplean las siguientes técnicas para evitar la duplicación innecesaria de contenido:
- Asegúrese de que solo se pueda acceder al contenido con una URL canónica
- Si su sitio debe devolver el mismo contenido en varias URL (por ejemplo, para una página de "vista de impresión"), especifique manualmente una URL canónica con un elemento de enlace en el encabezado del documento
- En los casos en que su sitio devuelva contenido similar según los parámetros codificados en la URL (por ejemplo, ordenar un catálogo de productos) excluya los parámetros de URL en las Herramientas para webmasters de Google
Sindicación de contenido
La publicación de contenido en su sitio que se ha publicado en otro lugar se denomina sindicación de contenido. Crear contenido duplicado a través de la sindicación de contenido puede estar bien:
- Mientras tengas permiso para hacerlo
- Usted les dice a sus usuarios cuál es el contenido y de dónde vino
- Usted enlaza a una fuente original (un enlace directo directo al contenido original de la página con la copia, no solo un enlace a la página de inicio del sitio donde se puede encontrar el original)
- Tus usuarios lo encuentran útil
- Tiene algo que agregar a ese contenido para que los usuarios prefieran encontrar ese contenido en su sitio que en cualquier otro lugar. (Comentario o crítica, por ejemplo).
- También tiene suficiente contenido original en su sitio (al menos 50% original, pero idealmente 80% original)
Si bien Google no penaliza por cada instancia de contenido duplicado, incluso el contenido duplicado no penalizado puede no ayudarlo a obtener visitantes:
- Estás compitiendo con todas las otras copias que están ahí fuera
- Es probable que Google prefiera la fuente original del contenido y la copia más respetable del contenido.
Google penalizará el contenido duplicado publicado en su sitio web de otras fuentes si:
- Parece ser raspado o robado (especialmente sin atribución).
- Los usuarios no reaccionan bien (especialmente haciendo clic de nuevo en Google después de visitar su sitio).
- Existen tantas copias que no hay razón para enviar a los usuarios a su copia.
- Su copia no es la original, más respetable o más utilizable; y no tiene ningún comentario o crítica.
- Su sitio no tiene suficiente contenido original para equilibrar todo el contenido republicado.
- Duplica páginas tan a menudo dentro de su propio sitio que Googlebot tiene problemas para rastrear el sitio completo.
Internacionalización y Geo Targeting
La localización de contenido es un área en la que duplicar contenido puede ser beneficioso para SEO. Está perfectamente bien publicar el mismo contenido en sitios dirigidos a diferentes países que hablan el mismo idioma. Por ejemplo, puede tener un sitio en los EE. UU., Un sitio en el Reino Unido y un sitio en Australia, todos con el mismo contenido.
Con un sitio para cada país, generalmente es posible clasificar mejor para los usuarios de ese país. Además, es posible atender específicamente a los usuarios de cada país con pequeñas diferencias de ortografía, precios en la moneda del país u opciones de envío de productos. Para obtener más información sobre cómo configurar sitios web con orientación geográfica, consulte ¿Cómo debo estructurar mis URL tanto para SEO como para localización?
Manejo de raspadores de contenido
Otros sitios que roban su contenido y lo republican sin permiso ocasionalmente pueden causar problemas de contenido duplicado para su sitio. Los motores de búsqueda trabajan arduamente para garantizar que sea difícil para los sitios scraper beneficiarse de la duplicación de su contenido . Si un sitio de raspador le está causando problemas, entonces puede ser posible eliminar el sitio del índice de Google presentando una solicitud DMCA con Google