Las versiones más recientes de Joomla ya no bloquean las carpetas /media/
y /templates/
:
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
No todas las extensiones se adhieren a las pautas de dónde colocar los archivos CSS y JS, etc., por lo que una buena solución es permitir que Google acceda a estos archivos independientemente de dónde se encuentren.
Puede lograr esto insertando algunas líneas al inicio de su robots.txt
archivo de esta manera:
#Googlebot
User-agent: Googlebot
Allow: *.css
Allow: *.js
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
EDITAR:
¡Gracias @ w3dk y @Stephen Ostermiller por los comentarios! Estás en lo cierto. Es mejor hacer algo como esto:
User-agent: *
Allow: *.css
Allow: *.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
Desafortunadamente, esto no parece funcionar según lo previsto porque las reglas más largas (más específicas) anulan las reglas más cortas y se ignoran las líneas permitidas. No parece hacer ninguna diferencia si las líneas de permiso siguen las líneas de no permitir o viceversa.
La única forma en que puedo evitar esto es haciendo algo como esto que parece funcionar cuando lo pruebo en las Herramientas para webmasters:
User-agent: *
Allow: /************************************************************.css
Allow: /************************************************************.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
EDIT 2 - MEJOR SOLUCIÓN:
Bien, investigué un poco más y encontré la respuesta en https://stackoverflow.com/a/30362942/1983389
Al parecer, la solución más correcta y más apoyado en todos los rastreadores web es algo así como lo siguiente (lo que permite el acceso a *.css
y *.js
archivos en los /bin
, /cache
, /installation
, /language
, /logs
, y /tmp
carpetas y, posiblemente, algunas de las otras carpetas no tiene mucho sentido):
User-agent: *
Allow: /administrator/*.css
Allow: /administrator/*.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Allow: /cli/*.css
Allow: /cli/*.js
Disallow: /cli/
Allow: /components/*.css
Allow: /components/*.js
Disallow: /components/
Allow: /includes/*.css
Allow: /includes/*.js
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Allow: /layouts/*.css
Allow: /layouts/*.js
Disallow: /layouts/
Allow: /libraries/*.css
Allow: /libraries/*.js
Disallow: /libraries/
Disallow: /logs/
Allow: /modules/*.css
Allow: /modules/*.js
Disallow: /modules/
Allow: /plugins/*.css
Allow: /plugins/*.js
Disallow: /plugins/
Disallow: /tmp/
robots.txt
ya que nadie (ni siquiera los motores de búsqueda ahora que Google está exigiendo lo que no debe rechazar) lo va a seguir de todos modos?