Una gran cantidad de correo no deseado pasa por el filtro en el servidor de correo que ejecuto con el truco relativamente simple de comenzar con pocas líneas de pérdida de peso (increíblemente obvio) u otro texto de estafa en la parte superior, seguido de un cuerpo de texto más grande de la documentación de programación - o, lo más malvado de todo, texto borrado de Stack Exchange . En el mejor de los casos, Spamassassin considera esto como BAYES_50, y sucede que el resto de los mensajes se construyen con el cuidado suficiente para que no golpeen otros disparadores. (Por ejemplo, los encabezados son mínimos y correctos). A menudo, los extractos incluidos se alinean lo suficiente con mis intereses legítimos como para que el mensaje en general se califique como BAYES_00, porque los tokens muy spam están abrumados por jugosas pepitas de resolución de problemas de administrador de sistemas.
La parte superior es tan obviamente spam (y, de hecho, tiende a ser muy similar a los mensajes de spam recibidos y entrenados anteriormente) que me sorprende que esté llegando, pero claramente lo es. Parece un pase separado que obtuvo las 25 líneas más altas (más o menos) del mensaje y pesó mucho para resolver el problema. ¿Hay alguna forma de hacer esto?
Varias personas han sugerido escribir expresiones regulares personalizadas. No quiero entrar en esto, ya que esta es una batalla perdida constante. Es lo que la gente hacía antes de que la clasificación bayesiana del spam entrara en uso, y en general fue terrible. Ningún humano puede mantener el ritmo . No es mucho más efectivo que simplemente presionar la tecla Eliminar para cada mensaje de spam, y mucho más trabajo de mi parte.
El filtrado bayesiano de spam funciona. Incluso funciona en este correo no deseado, si divido la parte "por encima del pliegue " y simplemente analizo esa parte, con el señuelo / paja eliminada. La pregunta es: ¿cómo puedo hacer que Spamassassin haga eso?