Estoy tratando de encontrar un enfoque para detectar anuncios fraudulentos en mi sitio web. Creo que el problema tiene mucho en común con la detección de correo electrónico no deseado (para el cual un clasificador bayesiano ingenuo es una solución común) ya que muchas de las señales que indican una estafa se encontrarán en el texto del anuncio.
Sin embargo, hay ciertas otras informaciones que pueden ser buenos indicadores de estafa, pero no estoy seguro de si un clasificador de Bayes podría usarlas, porque involucran valores numéricos (con valores sospechosos en los extremos del rango) que simples valores binarios correspondientes a la presencia o ausencia de una palabra en el texto.
Por ejemplo, muchos anuncios de estafa tienen el precio del artículo muy bajo (para atraer muchas vistas), por lo que me gustaría que un precio más bajo de lo normal sea un fuerte indicador de que el anuncio puede ser una estafa.
¿Bayes sigue siendo una buena opción para mis necesidades? Si no, ¿podría recomendarme un enfoque diferente?