La siguiente lista está organizada por la relativa facilidad de implementación, costo de mantenimiento y efectividad en la prevención de spam:
Deshabilitar todo el contenido generado por el usuario
Esta es una solución de tierra quemada que resta valor al crecimiento de una comunidad de usuarios alrededor de su sitio, sin embargo, también se garantiza que le ahorrará el tiempo y el esfuerzo de lidiar con el correo no deseado o la prevención del correo no deseado.
Además de deshabilitar el contenido generado por el usuario, no existe una solución garantizada para evitar que aparezca todo el spam (u otro contenido no deseado), sin embargo, una solución que disuade a la mayoría de los spammers debería ser suficiente si también brinda a los visitantes de su sitio la opción de marcar el contenido. como spam.
Externalizar la gestión de contenido generado por el usuario
Servicios como Disqus permiten a los webmasters externalizar la selección, el almacenamiento y la publicación de comentarios generados por los usuarios. (Nota: el uso de un servicio de terceros requiere una configuración adicional para garantizar que los motores de búsqueda indexen los comentarios)
CAPTCHA
Según Wikipedia , CAPTCHA significa "Prueba de Turing pública completamente automatizada para distinguir computadoras y seres humanos". Cualquier prueba automatizada diseñada para evitar que una computadora publique contenido es un CAPTCHA: esto incluye obligar a los usuarios a leer letras, números y palabras de imágenes, hacer simples rompecabezas o preguntas de matemáticas, o de otra manera "probar" que son personas.
La desventaja de CAPTCHA es que
La mayoría de las formas de CAPTCHA proporcionan un nivel de molestia para los usuarios.
No son 100% protectores. Tenga en cuenta que muchas de estas pruebas pueden ser completadas por computadoras si un programador competente decide invertir suficiente tiempo y esfuerzo en el problema
Preguntas y respuestas sobre CAPTCHA
El CAPTCHA más efectivo para sitios pequeños es la pregunta y respuesta CAPTCHA. Un Q&A CAPTCHA es una pregunta que un sitio web le pide al usuario que responda. La pregunta es algo que cualquiera que visite el sitio sabría, pero que un programa de computadora no sabría. Una pregunta de ejemplo para un sitio sobre SEO sería "¿Qué significa SEO". Esta pregunta sería fácil de responder para el lector promedio de ese sitio, pero cualquier programa de computadora no podría hacerlo.
NOTA: preguntas como "qué es 1 + 1" no funcionan bien, ya que a menudo se usan, y las personas que construyen robots de spam los programan para responder correctamente a esas preguntas.
Sin embargo, si su sitio recibe mucho tráfico, los spammers programarán sus robots para responder esas preguntas automáticamente, y el Q & a CAPTCHA ya no será efectivo.
Campo escondido
Si tiene un formulario y no desea que los spammers puedan usarlo, una buena forma de detenerlos es utilizando un campo oculto. Estos son muy simples de configurar: agregue un campo redundante a su formulario, escóndelo a través de CSS (o JavaScript) y detenga todo lo que intente ingresar un valor en ese campo. Los usuarios normales no podrán ver el campo y lo ignorarán porque está oculto para ellos, pero los programas informáticos empleados por los spammers intentarán ingresar un valor en ese campo porque no procesan CSS ni JavaScript. Para vencer a los robots de spam que cargan CSS o Javascript, puede agregar un campo adicional a los formularios con una solicitud para dejarlo vacío. Cualquier visitante humano lo dejará vacío y puede bloquear fácilmente los bots que agregan datos al campo. No olvide el hecho de que esto puede hacer que el sitio se vea poco profesional.
Análisis de tráfico y contenido
Los spammers tienen un número limitado de redes y máquinas para publicar (que normalmente usarán hasta que ya no funcionen). Las soluciones de análisis de tráfico recopilan datos de una gran cantidad de hosts para determinar si una publicación contiene contenido de spam conocido o si proviene de un host o red de spammer conocido.
Existe una variedad de soluciones de análisis de tráfico y CAPTCHA de terceros que son de uso gratuito (o barato) y la mayoría del software de gestión de contenido de código abierto incluye módulos integrados para el uso de servicios como Akismet y reCAPTCHA .
Bloquee palabras comúnmente contenidas en spam
Si observa que el correo no deseado en su sitio web comúnmente contiene palabras que los usuarios legítimos no usan (o no usan) (como "enlaces gratuitos a su sitio"), entonces bloquear a los usuarios para que no publiquen esas palabras es una solución afectiva. Si le preocupa que los usuarios que tienen un uso legítimo de esas palabras en sus publicaciones tengan problemas para publicar en su sitio, puede configurar el filtro para que ignore las publicaciones de usuarios establecidos.
rel="nofollow"
Los spammers tienden a centrarse en sitios que les permiten publicar enlaces que seguirán los motores de búsqueda (mejorando así el rango de búsqueda del sitio que anuncian).
Puede hacer que su sitio sea menos atractivo para los spammers agregando rel="nofollow"
a los enlaces incluidos en el contenido generado por el usuario, sin embargo, este enfoque puede no funcionar, ya que la mayoría del spam está automatizado y los spammers no tienen forma de saber si un sitio usa o no rel="nofollow"
enlaces.
Moderación por los usuarios
Cualquier persona puede publicar contenido, sin embargo, una vez que el contenido se muestra en el sitio, también se puede marcar como spam y eliminar (esta opción solo funciona en la práctica si los visitantes perciben que el contenido de spam es relativamente poco común: si se permite que el spam supere comentarios útiles , la mayoría de los visitantes no se molestarán en marcar spam).
Gamificación
La gamificación es una excelente manera de motivar a los usuarios a denunciar el spam. Considere agregar una función de "peso de la bandera" a su sitio: cuantos más usuarios de spam reporten, más puntos obtendrán. Esto hará que la búsqueda de spam sea más divertida y les dará a las personas que denuncian derechos de fanfarronear. Eso, a su vez, alentará a los usuarios a reportar spam.
Moderación por parte de los administradores
Un ser humano debe revisar cada elemento de contenido publicado antes de que se publique en el sitio; aunque esto no evita que se publique spam, sí evita que se muestre spam a los visitantes del sitio (reduciendo así el valor del sitio para los spammers humanos) .
registro de usuario
El registro de usuarios es una mejora con respecto a CAPTCHA porque los usuarios solo se ven obligados a demostrar que son humanos una vez antes de que se les permita comentar a su conveniencia; esto técnicamente no es una forma diferente de prevención de spam, aunque sí elimina el spam creado por un usuario específico o grupo de usuarios (como se identifica por nombre de usuario, correo electrónico, dirección IP u otro factor de identificación) más fácil de aplicar.
Usuarios nuevos moderados
En lugar de aprobar cada publicación, un administrador puede revisar los registros de nuevos usuarios para determinar si aprueba o no un usuario en función de si el registro del usuario es coherente con los spammers identificados o los robots de spam automatizados.
Limitar nuevas capacidades de usuario
Los spammers humanos rara vez recordarán regresar a las cuentas que han creado si no pueden publicar spam libremente en una cuenta; requieren que los nuevos usuarios creen un número determinado de publicaciones (si la comunidad tiene la capacidad de marcar el spam) y / o esperar un conjunto cantidad de tiempo antes de que se levanten las restricciones sobre la publicación de enlaces o publicaciones múltiples.
Cobrar Usuarios por Membresía
Si cobra por la membresía, incluso si la tarifa es pequeña, los spammers se verán obligados a sopesar el costo de la membresía con el valor de publicar spam en su sitio (y pasar su sitio a favor de objetivos más fáciles).
Sólo invitados
Si solo permite que las personas que han sido invitadas por otros usuarios se registren, esto reducirá el spam (los humanos generalmente no invitan a los robots).
Lo siguiente es del Proyecto BOTCHA , Drupal.
Tarro de miel
Implementación de honeypot-trap . La esencia de esto es que el campo se agrega al formulario con un cierto valor, que luego es modificado por JS. El spam es cualquier envío de formulario, cuyo valor calculado no es el mismo que necesitamos.
HoneyPot2
Lo mismo que arriba, pero usando como fuente de cálculo no el valor de un campo en particular, sino los datos de CSS.
ObscureUrl
Similar a HoneyPot2: construido por JS se compara con la necesidad. La diferencia es que el valor inicial se pasa a través del parámetro GET.
Conclusión
La mayoría de los webmasters encontrarán que una combinación de las soluciones enumeradas anteriormente (con la excepción de no permitir el contenido generado por el usuario) funciona mejor para su sitio y al menos una solución debe implementarse para evitar que el spam automatizado ahogue las discusiones de los visitantes.