De acuerdo con la lista en http://www.useragentstring.com/pages/useragentstring.php?typ=Browser con más de 9000 cadenas de agente de usuario de varios navegadores:
- 0 cadenas de agente de usuario de navegadores contienen la palabra "bot"
- 2 cadenas de agentes de usuario de navegadores contienen la palabra "rastreo"
- 0 cadenas de agente de usuario de navegadores contienen la palabra "araña"
(El 2 que contiene "rastreo" es el siguiente: "Mozilla / 4.0 (compatible; MSIE 5.01; Windows NT 5.0; YComp 5.0.2.6; MSIECrawler)" y "Mozilla / 4.0 (compatible; MSIE 5.01; Windows NT 5.0; MSIECrawler ) "Creo que es seguro no considerarlos.)
De acuerdo con la lista en http://www.useragentstring.com/pages/useragentstring.php?typ=Crawler con 442 cadenas de agente de usuario enumeradas como bots:
- 208 cadenas de agentes de usuario de bots contienen la palabra "bot"
- 63 cadenas de agentes de usuario de bots contienen la palabra "rastreo"
- 37 cadenas de agentes de usuario de bots contienen la palabra "araña"
- 282 cadenas de agentes de usuario de bots contienen "bot", "crawl" o "spider"
Mi conclusión: es seguro filtrar bots por cadenas de agente de usuario con las palabras "bot", "crawl" y "spider". No es a prueba de balas, pero definitivamente es mejor que nada.
Nota: Al buscar las palabras clave, utilicé la búsqueda sin distinción entre mayúsculas y minúsculas.
bot
,crawl
,spider
, e inclusosearch
.