Preguntas etiquetadas con web-crawlers

Un programa de computadora que accede a páginas web para diversos fines (para raspar contenido, proporcionar a los motores de búsqueda información sobre su sitio, etc.)

2
Disqus hilo de migración. Gotchas?
He estado migrando un sitio a un nuevo dominio. El sitio en sí es bastante sencillo (usa Jekyll), y todo ha ido bien, excepto la migración de hilos Disqus. He tenido un éxito parcial : algunos de los hilos han migrado con éxito, pero no todos. He probado el asistente …


3
Tácticas para lidiar con robots que se portan mal
Tengo un sitio que, por razones regulatorias, no puede indexarse ​​o buscarse automáticamente. Esto significa que debemos mantener alejados a todos los robots y evitar que recorran el sitio. Obviamente hemos tenido un archivo robots.txt que no permite nada desde el principio. Sin embargo, observar el archivo robots.txt es algo …



2
¿Qué etiqueta meta "robots" tiene preferencia?
Mi esposa trabaja en una escuela secundaria en Alemania. Hace poco noté que es extremadamente difícil encontrar la página de inicio de esa escuela usando Google. Miré el código fuente de la página y creo que he encontrado la razón: hay dos <meta name="robots">etiquetas; uno es <meta name="robots" content="all"> y …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.