Actualización : lo siguiente funciona, se imprime <meta name="robots" content="noindex,follow" />
en la sección de encabezado de todas las páginas a las que se accede a través de una ruta que comienza con comment
. Esto es para evitar el hecho de que una página como comment / 3 lleva internamente node / nid como argumentos, como jmarkel señaló anteriormente.
<?php
function metarobots_comment_help() {
$url_components = explode('/', request_uri());
if ($url_components[1] == 'comment') {
$elements = array(
'#tag' => 'meta',
'#attributes' => array(
'name' => 'robots',
'content' => 'noindex,follow',
),
);
drupal_add_html_head($elements, 'robots');
}
}
Con la ayuda de un comentario útil sobre la función arg .
Con suerte, esto eventualmente será abordado por el módulo Meta Tags: hay una solicitud de función , pero aún no está claro si el autor del módulo desea admitir esto.
[Mi comentario anterior] Solo quería agregar que el uso de robots.txt no es la respuesta, como ya lo notó, los enlaces siguen apareciendo en los resultados de búsqueda a pesar de usarlos Disallow: /comment
. Esto se espera, ya que robots.txt le dice al bot que no rastree esas páginas, pero no le dice a Google que no lo indexe. Como se explica en SEOmoz Robots.txt y las mejores prácticas de Meta Robots para la optimización de motores de búsqueda :
En la mayoría de los casos, los meta robots con parámetros "noindex, follow" deben emplearse como una forma de restringir el rastreo o la indexación.
Bloquear con Robots.txt: esto les dice a los motores que no rastreen la URL dada, pero les dice que pueden mantener la página en el índice y mostrarla en los resultados.
Bloquear con Meta NoIndex: esto le dice a los motores que pueden visitar, pero no se les permite mostrar la URL en los resultados. (Este es el método recomendado) Entonces, la metaetiqueta noindex que está buscando es lo que necesita.
robots.txt
archivo?