Respuestas:
Ningún bot que esté recolectando correos electrónicos o probando vulnerabilidades en su sitio respetará su robots.txt. De hecho, estos robots maliciosos miran el archivo robots.txt para mapear mejor su sitio. Si tiene algún punto, Disallow:
esto se utilizará para atacar mejor su sitio. Un pirata informático que está buscando manualmente en su sitio debería pasar más tiempo examinando los archivos / directorios que está intentando no permitir.
robots.txt no aumentará la seguridad de su sitio web ni evitará la recolección de direcciones de correo electrónico. robots.txt es una guía para que los motores de búsqueda omitan secciones de su sitio web. Estos no se indexarán y deben usarse para cualquier sección que no desee mostrar en los motores de búsqueda públicos.
Sin embargo, esto de ninguna manera evitará que otros robots descarguen todo su sitio para aumentar la seguridad o evitar la recolección de correo electrónico. Para aumentar la seguridad, debe agregar autenticación y solo permitir usuarios autenticados más allá de las secciones seguras. Para evitar la recolección de direcciones de correo electrónico, no coloque correos electrónicos en texto sin formato (o texto fácilmente descifrable) en un sitio web.
El archivo robots.txt solo sirve como una solicitud para que los robots y las arañas dejen en paz ciertas piezas de contenido; en realidad no puede impedir su acceso. Los bots "buenos" lo respetarán, pero los "malos" (probablemente los que desea bloquear) lo ignorarán y continuarán de todos modos.
En lugar de robots.txt, tal vez necesite usar códigos CAPTCHA.