¿Cómo funcionan los spambots?

43

Tengo un foro que recibe mucho impacto de los robots de spam del foro y, por supuesto, la mejor manera de derrotar a algo es conocer a tu enemigo. Me preocuparé por derrotar a esos spambots más tarde, pero en este momento me gustaría saber más sobre ellos. Al leer, me sorprendió la falta de información exhaustiva sobre el tema (o tal vez mi ineptitud para ingresar los términos de búsqueda correctos para obtener mejores resultados en Google).

Estoy interesado en aprender todo sobre spambots. He preguntado en otros foros y obtuve respuestas indirectas como "Los robots de spam siempre son usuarios que se registran en su sitio".

¿Cómo funcionan los foros de spam?
¿Cómo encuentran la página de 'registro de nuevos usuarios'? (Estoy especialmente sorprendido porque algunos foros no tienen una URL dedicada para esto, por ejemplo, www.forum.com/register.html, sino que utilizan cadenas de consulta o incluso otros métodos invisibles para la barra de URL)
¿Cómo saben qué ingresar en cada campo de 'registro de nuevo usuario'?
¿Cómo determinan qué es una página en la que pueden enviar spam / ingresar datos y qué no?
¿Incluso 'ven' esta página?
Si no, entonces supongo que se están comunicando con el servidor directamente, ¿cómo es esto posible? ¿Cómo lo hicieron?
¿Pueden los spambots del foro romper CAPTCHA? ¿Pueden resolver preguntas lógicas (¿cómo?) Preguntas de matemáticas?
¿Aplican ingeniería inversa a los scripts de validación anti-bot del lado del cliente? Scripts del lado del servidor?
¿Qué técnicas siguen siendo válidas para prevenirlas?
¿De dónde vienen los spambots? ¿Se está riendo alguien sentado detrás de la computadora mientras observa a su bot destruir sitio tras sitio? ¿O se están riendo, ya que simplemente lo 'lanzan' en Internet de alguna manera? ¿Los spambots son "ejecutados" por una computadora infectada en alguna parte? ¿Se replican ellos mismos?
etc.

spam botattack

— rlb.usa
fuente

48

¿Cómo encuentran la página de 'registro de nuevos usuarios'? (Estoy especialmente sorprendido porque algunos foros no tienen una URL dedicada para esto, por ejemplo, www.forum.com/register.html, sino que utilizan cadenas de consulta o incluso otros métodos invisibles para la barra de URL)

Encuentran nuevos sitios por:

Rastreando y buscando firmas de software conocido. Por lo general, este es un fragmento de texto como un copyright o una metaetiqueta, pero podría ser cualquier identificador consistente. Esto generalmente se aplica al software de blogs y foros.
Inclusión manual. Los seres humanos, cuya mano de obra es barata en muchas partes del mundo, buscan software o formularios conocidos que sean fácilmente explotables y los agregan a una base de datos. Esto generalmente se aplica al registro personalizado y a los formularios de contacto.
Ellos compran listas. Al igual que las direcciones de correo electrónico son vendidas por spammers, también se venden listas de sitios de destino conocidos vulnerables o preferidos.

¿Cómo saben qué ingresar en cada campo de 'registro de nuevo usuario'?

Saben qué ingresar en cada campo utilizando los nombres de los campos como guía. El 99,99% de las veces el campo de dirección de correo electrónico se denomina "correo electrónico" o algo que contenga la palabra "correo electrónico". No es necesario ser un científico espacial para saber que ese campo probablemente sea para una dirección de correo electrónico. Para cosas como nombres, ID de inicio de sesión, direcciones, etc., funciona según el mismo principio.

¿Cómo determinan qué es una página en la que pueden enviar spam / ingresar datos y qué no?

No les importa Las herramientas automatizadas pueden probar tantas formas en un período de tiempo tan corto prácticamente sin costo, por lo que probar todas las formas posibles es obvio. Cuando se trata de trabajo humano, pueden ser "guionistas" y probar lo obvio para ver si obtienen algún tipo de respuesta que indique que el formulario es potencialmente vulnerable. Básicamente, cualquier formulario es un objetivo potencial para ellos, como lo es cualquier página que acepte la entrada del usuario.

¿Cómo funcionan los foros de spam?

¿Incluso 'ven' esta página? Si no, entonces supongo que se están comunicando con el servidor directamente, ¿cómo es esto posible? ¿Cómo lo hicieron?

¿De dónde vienen los spambots? ¿Se está riendo alguien sentado detrás de la computadora mientras observa a su bot destruir sitio tras sitio? ¿O se están riendo, ya que simplemente lo 'lanzan' en Internet de alguna manera? ¿Los spambots son "ejecutados" por una computadora infectada en alguna parte? ¿Se replican ellos mismos?

Todo está automatizado. Las herramientas como xrumer se crean y venden, y contienen la capacidad de explotar software con vulnerabilidades conocidas. Cualquiera puede comprarlo y después de configurarlo, más o menos dispara y olvida. Accede a todos los foros de su lista y trata de enviarlo lo mejor que puede. Solo por la fuerza bruta es exitoso y vale la pena para los spammers. Por eso nunca se detienen. Apenas tienen que levantar un dedo para que funcione.

¿Pueden los spambots del foro romper CAPTCHA? ¿Pueden resolver preguntas lógicas (¿cómo?) Preguntas de matemáticas?

Si, pero no siempre. Depende de qué tan bien se implemente. Pero muchos captchas, incluidos los ofrecidos por las grandes empresas, han sido golpeados y son efectivamente inútiles. Es por eso que se requieren múltiples formas de protección para detenerlos. Incluso entonces, los humanos generalmente pueden vencer a cualquier sistema.

¿Qué técnicas siguen siendo válidas para prevenirlas?

De una respuesta anterior : podría hacer varias cosas (y debería estar haciendo más de una) incluyendo:

1) Poner un campo falso que solo los bots verán. Luego, si ese campo se envía con el resto del formulario, puede ignorarlo (y prohibirlo si lo desea). También puedes atrapar a los robots malos que siguen un enlace oculto .

2) Use un CAPATCHA como reCAPTCHA

3) Use un campo que requiera que el usuario responda una pregunta como qué es 5 + 3. Cualquier ser humano puede responderla, pero un bot no sabrá qué hacer, ya que se rellena automáticamente en función de los nombres de campo. Por lo tanto, ese campo será incorrecto o faltante, en cuyo caso el envío será rechazado.

4) Use un token y póngalo en una sesión y también agréguelo al formulario. Si el token no se envía con el formulario o no coincide, entonces está automatizado y puede ignorarse.

5) Busque envíos repetidos desde la misma dirección IP. Si su formulario no recibe demasiadas solicitudes, pero de repente es probable que esté siendo golpeado por un bot y debería considerar bloquear temporalmente la dirección IP.

6) Usa Akismet . Es excelente para identificar el spam.

— John Conde
fuente

55

+1 por la respuesta completa. Tuve un problema de spam e implementé el elemento de formulario oculto y lo llamé "correo electrónico" / "correo" y la entrada de dirección de correo electrónico real que denominé "dirección". ¡No más spam!

— mar10

1

Una buena publicación sobre cómo lidiar con los trolls (la idea es la misma para los robots de spam): codinghorror.com/blog/2011/06/suspension-ban-or-hellban.html .

— ercpe

Para los captchas, depende de qué herramienta estén usando para derrotarlos. Hay programas de software que a veces (y no siempre) obtienen captchas aprobadas, y luego hay servicios que utilizan mano de obra barata para resolver captchas y tienen una mayor tasa de éxito.

— ub3rst4r

11

¿Cómo funcionan los foros de spam?

Los programadores talentosos (aunque malvados) los escriben: probablemente haya tantos tipos diferentes de spambots como personas que los escriben, pero, desafortunadamente, solo unos pocos autores de spambot comparten y venden su trabajo para arruinar la vida de los administradores ...

Una aplicación popular de spam en el foro se llama "xrumer".

Si bien me doy cuenta de que esto no responde a todas sus preguntas, creo que vale la pena mencionar que cualquier cosa que un bot no pueda hacer bien (como resolver preguntas complejas de lógica no estática) puede hacerla un trabajador mal pagado en el extranjero. El spam es un negocio muy parecido a cualquier otro y no faltan mano de obra barata para enviar mensajes de spam.

— danlefree
fuente

44

Siento que acabo de ver una vaca procesada en una planta de carne. Pero muy informativo.

— rlb.usa

Video de interés, divertido que se hizo la víspera de Navidad; fecha fue 12-25-2006 12:15 am ... :-)

— errores

Ack! aparentemente no es tan talentoso ... Ese programa me recuerda a FriendBlaster (solíamos usarlo en el trabajo, estaba en contra, pero el jefe no me escuchaba). No dudo de la cantidad de tiempo y esfuerzo que el autor puso en el programa. Pero, sinceramente, nada de lo que se está realizando es tan difícil de implementar (y mal implementado en el caso de FriendBlaster). Mucho más impresionantes son los piratas informáticos y los investigadores de seguridad que desarrollan exploits y rompen los esquemas de DRM pocas semanas después de su lanzamiento.

— Lèse majesté

2

Hice complemento Anti-Spam para WordPress , que bloquea el spam bastante bueno sin Captcha o cualquier otra cosa.

Cómo funciona: se agregan dos campos adicionales al formulario de comentarios. Primero está la pregunta sobre el año actual. El segundo debe estar vacío. Si el usuario visita el sitio, entonces el primer campo se responde automáticamente con javascript, el segundo campo se deja en blanco y ambos campos están ocultos e invisibles para el usuario. Si el spammer intenta enviar un formulario de comentarios, se equivocará con la respuesta en el primer campo o intenta enviar un campo vacío y el comentario de spam será rechazado. El usuario no tiene que ingresar a Captcha ni nada más para demostrar que no es un bot, todo está hecho por javascript.

Puede descargar el complemento y usar el código para resolver problemas con el spam en su sitio.

— webvitaly
fuente

1

¿Entonces sus usuarios necesitan javascript para poder registrarse? Eso es una pérdida de accesibilidad, ¿verdad?

— Augustin Riedinger

@AugustinRiedinger El complemento antispam con JavaScript deshabilitado funciona como un simple enfoque de captha. Hay aproximadamente menos del 2% de los usuarios con JavaScript deshabilitado.

— webvitaly

Quieres decir que mostrarías el captcha en ese caso, ¿verdad? Sé que hay muy pocos usuarios allí, pero estaba pensando en términos de mejores prácticas. Sin embargo, lea cosas interesantes al respecto.

— Augustin Riedinger

@AugustinRiedinger Sí, muestro una pregunta similar al captcha sobre el año en curso si el usuario ha deshabilitado JavaScript.

— webvitaly

0

Al tratar de derrotarlos, una cosa que debo tener en cuenta es que su propósito es generalmente publicar enlaces a tantos sitios web como sea posible para el beneficio de SEO de sombrero negro.

Se preocupan por la cantidad de sitios a los que obtienen acceso, y no específicamente por su sitio. Alguien que solo quiera enviar spam solo a su sitio podría simplemente registrarse sin usar un robot.

Como tal, estoy bastante seguro de que una prueba a medida bien escrita (por ejemplo, preguntas a las que los miembros de su foro sabrán la respuesta) casi siempre será más efectiva contra los robots que cualquier prueba preescrita que los robots probablemente sean sabios a.

Por ejemplo, si un robot descifró Recaptcha, tendría acceso a millones de formularios para enviar spam. Si rompió una prueba a medida, entonces solo tendría acceso a un sitio web, por lo que ningún bot de spam automatizado se molestará en hacerlo.

https://www.projecthoneypot.org puede proporcionar algunos buenos datos para usar (por ejemplo, palabras clave y ips para bloquear)

— Richard B
fuente