Me encontré con este artículo en mis noticias de SEO hoy. Parece implicar que puede usar Noindex:directivas además de las Disallow:directivas estándar en robots.txt .
Disallow: /page-one.html
Noindex: /page-two.html
Parece que evitaría que los motores de búsqueda rastreen la página uno y que no indexen la página dos.
¿Esta directiva robots.txt es compatible con Google y otros motores de búsqueda? ¿Funciona? ¿Está documentado?
disallowGoogle deja de descubrir enlaces en las páginas principales y secundarias, si es que existen. Si bien noindexsimplemente detiene la página que se enumera, no detiene el descubrimiento mientras que no lo hace.
nofollowfuncionan las metaetiquetas. Sería bueno saber si ese también es el caso de robots.txt .
<a rel="no-follow">. No veo ninguna razón por la que se trataría de manera diferente. Obviamente, esto no es oficial e incluso John Muller me recomienda que no lo use en el archivo robots.txt, pero aparte de su tweet, no he logrado encontrar mucha información al respecto.
Noindexdirectiva dentro de los robots.txtarchivos como un error.