Me encontré con este artículo en mis noticias de SEO hoy. Parece implicar que puede usar Noindex:
directivas además de las Disallow:
directivas estándar en robots.txt .
Disallow: /page-one.html
Noindex: /page-two.html
Parece que evitaría que los motores de búsqueda rastreen la página uno y que no indexen la página dos.
¿Esta directiva robots.txt es compatible con Google y otros motores de búsqueda? ¿Funciona? ¿Está documentado?
disallow
Google deja de descubrir enlaces en las páginas principales y secundarias, si es que existen. Si bien noindex
simplemente detiene la página que se enumera, no detiene el descubrimiento mientras que no lo hace.
nofollow
funcionan las metaetiquetas. Sería bueno saber si ese también es el caso de robots.txt .
<a rel="no-follow">
. No veo ninguna razón por la que se trataría de manera diferente. Obviamente, esto no es oficial e incluso John Muller me recomienda que no lo use en el archivo robots.txt, pero aparte de su tweet, no he logrado encontrar mucha información al respecto.
Noindex
directiva dentro de los robots.txt
archivos como un error.