La mayoría de los enfoques ingenuos del problema tienen serios problemas. Lo peor es cómo bash.org y qdb.us muestran las citas: los usuarios pueden votar una cita hacia arriba (+1) o hacia abajo (-1), y la lista de las mejores citas está ordenada por la puntuación neta total. Esto sufre un horrible sesgo de tiempo: las citas más antiguas han acumulado una gran cantidad de votos positivos a través de una simple longevidad, incluso si son solo marginalmente humorísticas. Este algoritmo podría tener sentido si los chistes se volvieran más divertidos a medida que envejecían, pero créeme, no es así.
Hay varios intentos de solucionar este problema: observar el número de votos positivos por período de tiempo, ponderar los votos más recientes, implementar un sistema de decadencia para los votos más antiguos, calcular la proporción de votos positivos y negativos, etc. La mayoría adolece de otros defectos.
La mejor solución, creo, es la que utilizan los sitios web The Funniest The Cutest , The Fairest y Best Thing : un sistema de votación Condorcet modificado :
El sistema le da a cada uno un número basado en, de las cosas a las que se ha enfrentado, qué porcentaje de ellas supera habitualmente. Entonces, cada uno obtiene la puntuación porcentual NumberOfThingsIBeat / (NumberOfThingsIBeat + NumberOfThingsThatBeatMe). Además, las cosas se excluyen de la lista superior hasta que se hayan comparado con un porcentaje razonable del conjunto.
Si hay un ganador de Condorcet en el set, este método lo encontrará. Dado que eso es poco probable, dada la naturaleza estadística, encuentra el que está "más cerca" de ser un ganador de Condorcet.
Para obtener más información sobre la implementación de dichos sistemas, la página de Wikipedia sobre Pares clasificados debería ser útil.
El algoritmo requiere que las personas comparen dos objetos (su opción Pick-A-or-B), pero francamente, eso es algo bueno. Creo que está muy bien aceptado en la teoría de la decisión que los seres humanos son mucho mejores comparando dos objetos que en la clasificación abstracta. Millones de años de evolución nos hacen buenos para elegir la mejor manzana del árbol, pero terribles para decidir qué tan cerca se acerca la manzana que elegimos a la verdadera forma platónica de manzana. (Por cierto, esta es la razón por la que el Proceso de Jerarquía Analítica es tan ingenioso ... pero eso se está saliendo un poco del tema).
Un último punto a destacar es que SO usa un algoritmo para encontrar las mejores respuestas que es muy similar al algoritmo de bash.org para encontrar la mejor cita. Funciona bien aquí, pero falla terriblemente allí, en gran parte porque es probable que se edite una respuesta antigua, altamente calificada, pero ahora desactualizada. bash.org no permite la edición, y no está claro cómo editaría chistes de hace una década sobre memes de Internet con fecha actual, incluso si pudiera ... En cualquier caso, mi punto es que el algoritmo correcto generalmente depende de los detalles de su problema. :-)