¿Por qué los motores de búsqueda no indexan mi contenido?


29

Este es un par general de preguntas y respuestas generales de la comunidad wiki destinado a abordar cualquier pregunta relacionada con las razones por las que un sitio o los contenidos específicos del sitio no aparecen en los resultados del motor de búsqueda.

Si su pregunta se cerró como un duplicado de esta pregunta y considera que la información proporcionada aquí no proporciona una respuesta suficiente, abra una discusión sobre Pro Webmasters Meta .

Mi sitio (o páginas específicas en mi sitio) no aparece en los resultados del motor de búsqueda.

¿Por qué mi contenido no está indexado y qué puedo hacer al respecto?

Respuestas:


36

Hay varias razones por las que su contenido puede no aparecer en los resultados del motor de búsqueda, sin embargo, es importante tener en cuenta que el índice de un motor de búsqueda puede contener páginas que no se muestran en su página de resultados .

Cómo saber si su contenido está realmente indexado

En realidad, puede ser difícil saber si su contenido está indexado.

  • Busque todos los documentos de su sitio y vea cuántos se enumeran
    • Google: ingrese site:example.com(donde example.comestá su dominio, no debe haber ningún espacio después de los dos puntos).
    • Bing: entrarsite: example.com
    • Yahoo: ingrese site: example.com(o use el formulario de búsqueda avanzada)
  • Busque un documento específico por una oración única de ocho a doce palabras y busque esa oración entre comillas. Por ejemplo, para encontrar este documento, puede optar por buscar "la cantidad de razones por las que su contenido puede no aparecer en los resultados del motor de búsqueda"
  • Además de lo anterior, busque palabras clave utilizando inurl:y intitle:puede intentar algo como keyword with another keyword inurl:example.comesto , esto traerá páginas que están indexadas solo para el dominio especificado.

    • Inicie sesión en las herramientas para webmasters para ver estadísticas del propio motor de búsqueda sobre cuántas páginas están indexadas desde el sitio
    • Herramientas para webmasters de Google : la información está disponible en "Salud" »" Estado del índice ". Si ha enviado mapas del sitio, también puede ver cuántos documentos en cada archivo de mapa del sitio se han indexado.
    • Herramientas para webmasters de Bing

En algunos casos, puede parecer que los documentos no están indexados a través de uno de estos métodos, pero los documentos se pueden encontrar en el índice utilizando otros métodos. Por ejemplo, las herramientas para webmasters pueden informar que pocos documentos están indexados, incluso cuando puede buscar sus oraciones y encontrar los documentos en el motor de búsqueda. En tal caso, los documentos están realmente indexados.

Cómo se indexa el contenido

Antes de que los motores de búsqueda indexen el contenido, deben encontrarlo utilizando un rastreador web. Debe verificar los registros de su servidor web para ver si los rastreadores de los motores de búsqueda (identificados por su agente de usuario, por ejemplo , Googlebot , Bing / MSNbot ) están visitando su sitio.

Los motores de búsqueda más grandes como Google y Bing suelen rastrear sitios con frecuencia, pero es posible que el rastreador no conozca el sitio nuevo. Puede notificar a los motores de búsqueda sobre la existencia de su sitio registrándose como su webmaster ( Herramientas para webmasters de Google , Herramientas para webmasters de Bing ) o, si el motor de búsqueda no proporciona esta función, enviando un enlace a sus rastreadores (por ejemplo, Yahoo ).

¿Cuánto tiempo lleva en línea su sitio / contenido?

Los motores de búsqueda pueden indexar el contenido muy rápidamente después de que se haya encontrado, sin embargo, estas actualizaciones se retrasan ocasionalmente. Los motores de búsqueda más pequeños también pueden ser mucho menos receptivos y tardar semanas en indexar contenido nuevo.

Si su contenido solo ha estado en línea durante varios días y no tiene enlaces de otros sitios (o sus enlaces provienen de sitios que los rastreadores no visitan con frecuencia), probablemente no esté indexado. Si su sitio no ha estado activo durante más de unos pocos meses, es posible que los motores de búsqueda no confíen lo suficiente como para indexar mucho contenido de él todavía.

¿El contenido ha sido excluido por el webmaster?

Este paso es especialmente importante si está tomando el control de un sitio de otra persona y hay un problema con una página o directorio específico: verifique las exclusiones de robots robots.txt y META y elimínelas si desea que los rastreadores indexen el contenido que se excluye.

¿Hay algún problema técnico que impida que tu contenido sea indexado?

Si tiene un sitio establecido pero no se indexa contenido específico (no hay visitas de rastreadores web en las URL donde reside el contenido), las herramientas para webmasters proporcionadas por Google y Bing pueden proporcionar información de diagnóstico útil.

La documentación de Errores de rastreo de Google proporciona una amplia experiencia sobre problemas comunes para los rastreadores web que evitan que el contenido se indexe y, si utiliza las Herramientas para webmasters de Google, recibirá una alerta si se detecta alguno de estos problemas en su sitio.

Corrija los errores y las configuraciones incorrectas lo más rápido posible para garantizar que todo el contenido de su sitio esté indexado.

¿El contenido es de baja calidad?

Los motores de búsqueda no indexan la mayoría de las páginas que rastrean. Solo indexan el contenido de mayor calidad. Los motores de búsqueda no indexarán contenido si:

  • Es spam, galimatías o tonterías.
  • Se encuentra en otra parte. Cuando los motores de búsqueda encuentran contenido duplicado, eligen solo uno de los duplicados para indexar. Por lo general, ese es el original que tiene más reputación y enlaces.
  • Es delgado Necesita más que un par de líneas de texto original. Preferiblemente mucho más. Es poco probable que las páginas creadas automáticamente con poco contenido, como una página para cada uno de sus usuarios, se indexen.
  • No tiene suficiente reputación o enlaces. Una página puede estar enterrada demasiado profundo en su sitio para clasificar. Es improbable que se indexe cualquier página sin enlaces externos y más de unos pocos clics desde la página de inicio.

¿Se indexa parte de su contenido, pero no todo?

Si su sitio tiene cientos de páginas, Google casi nunca elegirá indexar cada página. Si su sitio tiene decenas de miles de páginas, es muy común que Google elija indexar solo una pequeña parte de esas páginas.

Google elige el número de páginas para indexar desde un sitio en función de la reputación general del sitio y la calidad del contenido. Google suele indexar un porcentaje mayor de un sitio a lo largo del tiempo a medida que crece la reputación del sitio.



1

Creo que no necesito repetir lo mismo que se indicó anteriormente, sin embargo, si no está familiarizado con la nueva herramienta, esta es la forma de verificarla a continuación.

Puede verificar si su archivo robot.txt no está bloqueando el contenido accediendo a la antigua herramienta de prueba de robots.txt de Google Webmaster

ingrese la descripción de la imagen aquí

Google Search Console (nueva versión)

La consola de búsqueda de Google proporciona información valiosa que la versión anterior. Verifique los problemas directamente desde Google Search Console, si su página está rastreada o no, indexada o no, en vivo o no, y los problemas si los hay.

  1. Inicie sesión en la Consola de búsqueda de Google de su sitio web
  2. Si tiene varias propiedades de dominio, asegúrese de haber seleccionado la deseada.

Herramienta obsoleta en Google Webmaster

Esto está desactualizado ahora

Así es como puede pasar por la nueva Consola de búsqueda

Nueva consola de búsqueda de Google


0

Si tiene un archivo robots.txt en su directorio raíz, podría estar diciéndole a Google que no indexe su sitio.

¿Has comprobado eso?

Por lo general, es seguro simplemente eliminar (o cambiar el nombre) de esos archivos, ya que suena como si DESEA ser indexado.

IMPORTANTE: Esto puede ser un factor decisivo si está intentando que Google Adsense funcione en su sitio.

No importa dónde coloque su código especial, si no está siendo indexado, se le informará que su sitio está caído para que no puedan verificarlo.


El archivo robots.txt tiene un conjunto de reglas definidas por el usuario para rastrear o no, por lo que eliminarlo no es una solución, ya que este es el primer archivo que se rastrea. La mejor solución es arreglar las reglas, probar el archivo robots.txt, agregar la directiva del mapa del sitio en su robot.txt, mantener su mapa del sitio actualizado con lastmod y cambiar los atributos de frecuencia.
Deepak Mathur
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.