¿Duelo por robar pagerank de mi sitio web?

Estaba buscando hoy en mis herramientas de Google Webmaster para mi sitio web y veo títulos duplicados para las siguientes páginas en mi sitio web (pequeña muestra de muchas en el índice de mi sitio):

/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business

¡Estas ciertamente no son páginas que he creado!

También eché un vistazo a mis datos estructurados que he creado en mi sitio y puedo ver esto (una pequeña muestra de muchos):

Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)

Nada de esto es el resultado de algo que he hecho. Obviamente es una especie de dolor o un plan elaborado para robar pagerank.

Ayer instalé redireccionamientos y canónicos 301 automatizados de php en todas mis páginas para tratar de reafirmar esto (gracias a la maravillosa ayuda de la gente de desbordamiento de pila). Pero me gustaría entender más sobre esto y cuál es su objetivo.

— Amy Neville
fuente

Aunque no haya hecho los títulos de las páginas, ¿son estas páginas algo que ha creado? ¿permiten que las personas creen páginas en su sitio, etc.? Cuéntanos más sobre el sitio en cuestión ya que por el momento nadie lo adivina. Podría ser malware, podría ser su sistema de administración de contenido que proporcione múltiples URL con diferentes títulos, podría ser gente tratando de dañar su reputación (mente dudosa). Edite su pregunta y dénos una mejor idea del sitio que ejecuta, con los puntos clave que he mencionado, también una URL del sitio en cuestión es muy útil en estos temas.

— Simon Hayter

Estas no son páginas que he creado. Sin embargo, noté que con mi wiki hay una página para representar páginas no creadas y no se sirve ningún error 404

— Amy Neville

El material de datos estructurados es totalmente extraño, aunque simplemente no entiendo de dónde puede venir eso.

— Amy Neville

Hola, Amy, creo que te atrapé y, aunque realizo un trabajo de investigación, creo que tengo una respuesta para ti, aunque no te guste;)

— Simon Hayter

Hola, trabajo con el equipo de Herramientas para webmasters de Google. Este fue un problema de nuestro lado que solo afectó a la herramienta de prueba de datos estructurados y al panel de control apropiado en las Herramientas para webmasters. No afectó la búsqueda en la web, y esto probablemente no fue realmente algo que se encontró en su sitio. ¡Perdón por la confusion!

— John Mueller,

Algunas formas en que las páginas inexistentes terminan en el Índice de Google

Hay 3 formas en que las páginas inexistentes pueden terminar en Google o en cualquier otro motor de búsqueda, y estas son:

Sus páginas están vinculadas a estas páginas. (Esto puede estar en el mapa del sitio, una página de perfil, un comentario de blog o un enlace basado en href ...) He visto algunos complementos de WordPress, por ejemplo, que contienen dichos enlaces porque se han desarrollado en un sitio y luego se han subido a la biblioteca de complementos, pero el desarrollador tiene una configuración de caché que se ha encontrado con el complemento.
Un vínculo de retroceso apunta a estas páginas.
He visto páginas y cadenas de índice de Google que simplemente no existen, aunque las suyas parecen tener palabras que no veo cómo Googlebot podría encontrarlas.

Vínculos internos

Ahora es más probable que sea un enlace interno de algún tipo porque busqué en Google sus páginas de título y todo lo que encontré fueron 3 páginas, Pro Webmaster, otro sitio que muestra imágenes de este sitio y el suyo. Parece que alguien ha creado este enlace, o una aplicación / plugin / malware lo ha hecho.

Investigando

Entonces, para descartar que sus usuarios, usted o una aplicación hayan creado estos enlaces, lo que debe hacer es iniciar sesión en el SQL (idealmente PHPMyadmin) y buscar las cadenas. Asegúrese de que la base de datos esté limpia de estas páginas. Luego, suponiendo no obtiene resultados, es hora de buscar archivos de caché y archivos php para estas páginas. Si no encuentra nada, entonces es probable porque alguien también lo vinculó y ahora no está en Google porque se ha eliminado.

Redirigir la /?cadena puede ser dañino si alguien quiere atraparte

Ahora puedo ver que ha eliminado todas las /?title=cadenas y las ha redirigido a la página de inicio, aunque esto es algo correcto, también puede ser perjudicial al mismo tiempo y lo explicaré.

Si alguien está enviando spam a su sitio con vínculos de retroceso desagradables, lo peor que puede hacer es comenzar a redirigirlos a la página de inicio, ya que Google puede ver esto como una manipulación del pagerank. Esto se debe a que el 301 redirige el flujo de jugo desde el enlace externo, si ese enlace sucede es un sitio de Viagra, entonces le estás dando una falsa indicación a Google en el redireccionamiento y esto puede volver y morderte.

Tengo que amar los buenos viejos 404

Lo correcto en las páginas que simplemente no existen es usar un 404, que son perfectamente normales y de ninguna manera da a Google la impresión de que su sitio está roto. Cualquier página que no exista nunca terminará en el índice de Google y cualquier persona que vuelva a vincular a páginas inexistentes no debería dañar su sitio si un 404 regresa, sin embargo, como se mencionó un 301 a la página de inicio 'PODRÍA' porque retiene el jugo.

Hace 1-2 años, diría que la redirección de cadenas era el mejor método, pero desde las actualizaciones de Google Panda y Penguin, he visto sitios que intentan de todo tipo para tratar de dañar la reputación en línea (Básicamente, Panda, Penguin castiga a los sitios por enlaces de spam, enlaces pagados y, en general, enlaces no relevantes) Aunque Google afirma que es imposible dañar la reputación de otros en línea, plantea la pregunta de si esto es cierto, ¿por qué hay tantos que actualmente envían spam a otros y cómo saben que no es el webmaster tratando de manipular sus propias clasificaciones? ? un área discutible, pero terminemos esto ... Creo que un 404 se adaptará mejor a usted en esta situación.

La edición de la consulta debe ser directa, en lugar de redirigir para /eliminar la cadena y luego 301 a /404/.

— Simon Hayter
fuente

no me deja votar pero esa es una gran respuesta gracias

— Amy Neville

No hay problema en absoluto, ahora obtén Lucky Charms en todas tus vallas publicitarias;)

— Simon Hayter

@SimonHayter ¿Google capta la respuesta HTTP 404 e ignora el contenido de la página? ¿Qué opinas de una página 404 que redirige javascript a la página de inicio? Solo curiosidad por las implicaciones

— Jonathan