Preguntas etiquetadas con robots.txt

Robots.txt es un archivo de texto utilizado por los propietarios de sitios web para dar instrucciones sobre su sitio a los robots web. Básicamente le dice a los robots qué partes del sitio están abiertas y qué partes están cerradas. Esto se llama Protocolo de exclusión de robots.


3
¿Google Preview obedece a Robots.txt?
Porque seguro que se ve así. Para mis sitios, no permitimos el directorio de imágenes y las vistas previas son imágenes que faltan, lo que hace que el sitio se vea inestable. ¿Es este el caso y hay una manera de permitir que solo el bot de vista previa acceda …


1
¿Cómo funciona "Noindex:" en robots.txt?
Me encontré con este artículo en mis noticias de SEO hoy. Parece implicar que puede usar Noindex:directivas además de las Disallow:directivas estándar en robots.txt . Disallow: /page-one.html Noindex: /page-two.html Parece que evitaría que los motores de búsqueda rastreen la página uno y que no indexen la página dos. ¿Esta directiva …

2
Solo permita que los robots de Google y Bing rastreen un sitio
Estoy usando el siguiente archivo robots.txt para un sitio: El objetivo es permitir que googlebot y bingbot accedan al sitio excepto la página /bedven/bedrijf/*y bloqueen el rastreo de todos los demás bots. User-agent: googlebot Disallow: /bedven/bedrijf/* Crawl-delay: 10 User-agent: google Disallow: /bedven/bedrijf/* Crawl-delay: 10 User-agent: bingbot Disallow: /bedven/bedrijf/* Crawl-delay: 10 …

1
Combina agentes de usuario en robots.txt
¿Pueden los agentes de usuario aparecer juntos, seguidos de sus reglas comunes como en un robots.txt ? User-agent: Googlebot User-agent: ia_archiver #Alexa User-agent: BingPreview #Microsoft User-agent: bingbot #Microsoft User-agent: MSNBot #Microsoft User-agent: Slurp #Yahoo User-agent: Ask Jeeves/Teoma #Ask Disallow: /adm30_buds/




1
¿Debo bloquear las páginas de archivos de Wordpress de los motores de búsqueda?
Uso WordPress y /sample-post/URL para mis publicaciones y /yyyy/mm/para los archivos. Google ha indexado el sitio por completo. Dado que los archivos actualmente muestran publicaciones completas, he pensado que no debería permitir que Google indexe las páginas del archivo porque contienen las publicaciones completas y será contenido duplicado. Por lo …


3
Cuando mueve un sitio a través de una redirección 301, ¿debe configurar un archivo robots.txt que no permita que los robots rastreen la dirección anterior?
Un sitio en el que estoy trabajando movió un subdominio a otro subdominio a través de una redirección 301. Sin embargo, cuando se verifica el archivo robots.txt del antiguo subdominio, tiene un archivo robots.txt que no permite que los rastreadores web de los motores de búsqueda lo rastreen. ¿Es este …

5
¿Deberíamos modificar nuestro archivo robots.txt de Joomla después del anuncio de Google sobre el rastreo de CSS y JavaScript?
He encontrado un anuncio de Google: http://googlewebmastercentral.blogspot.in/2014/10/updating-our-technical-webmaster.html Afirma: Para una representación e indexación óptimas, nuestra nueva directriz especifica que debe permitir que Googlebot acceda a JavaScript, CSS y archivos de imagen que usan sus páginas. Esto le proporciona una representación e indexación óptimas para su sitio. No permitir el rastreo …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.