¿Por qué la FIDE todavía usa Elo?


11

Me ha impresionado la forma en que funciona el sistema de calificación Glicko . En particular:

  • más juegos jugados recientemente hacen que su calificación se estabilice
  • Menos juegos jugados recientemente hacen que su calificación fluctúe hasta que tenga varios juegos recientes en su haber

USCF modificó su sistema para que sea similar hace unos años (donde hay una escala móvil para amplificar o amortiguar el cambio de calificación para un partido determinado), y ahora que Glickman (el inventor de Glicko) está en el tablero de calificación de la USCF, Me imagino que eventualmente adoptarán un sistema aún más flexible, como el suyo.

¿Hay alguna razón (aparte de ser resistente al cambio, o que simplemente no se hayan dado cuenta todavía) de que la FIDE no adopte un sistema de calificación más preciso?

Respuestas:


9

No está comprobado que Glicko sea más preciso. Glicko simplemente resuelve el problema de una manera diferente, con un énfasis diferente. Considere que todos estos sistemas abstraen una mente humana a un número de 4 dígitos.

Hay mucha política en las clasificaciones; Es un tema delicado. Si la FIDE lo adoptara, producirían una nueva lista de los 100 mejores, y muchos GMs probablemente estarían molestos.

El sistema ELO es muy fácil de entender; La transparencia es importante. Los sistemas más complejos tienen desventajas inmediatas.


66
+1, aunque no estoy de acuerdo con el primer párrafo, el resto es bastante cierto. 1) Glicko ha demostrado ser más preciso en promedio (medido en términos de la frecuencia con la que puede predecir quién ganará un partido determinado). 2) Acerca de abstraer una mente humana a un número, este no es realmente el caso. Es una medida de habilidad, de modo que puede calcular las probabilidades (para ganar / empatar / perder) al comparar niveles de habilidad. Todo está respaldado por las matemáticas y las estadísticas. En Glicko-2 hay incluso un nuevo factor de volatilidad, para aquellos jugadores que juegan de manera inconsistente (permitiendo que sus calificaciones fluctúen más).
Eve Freeman,

1
Interesante. Sin embargo, afirmaría que "mejor en promedio" no es necesariamente "mejor". ¿Qué pasa si los momentos en que no es más preciso causa un daño real? Sin embargo, iré a leerlo.
Tony Ennis



7

Según tengo entendido, el sistema de calificación de Glicko agrega un puntaje de confiabilidad al número de calificación, lo que puede proporcionar una mayor imparcialidad con respecto a los cálculos de ajuste de puntaje de calificación. Obviamente, esto podría llevar a la suposición errónea de que existe una correlación entre jugar juegos calificados y la fuerza de juego resultante (ya que no jugar disminuye el puntaje de confiabilidad que a su vez devalúa su número de calificación de alguna manera). Veo muchos problemas relacionados con el puntaje de confiabilidad, aunque debo admitir que no soy un experto en las sutilezas del sistema. Solo para elegir tres:

  • Un jugador que juegue solo el juego clasificado raro podría no recibir más invitaciones. Imagina que eres un director de torneo que invita a jugadores atractivos. Ahora tienes que elegir entre 10 jugadores, todos los cuales tienen el mismo número de clasificación, pero diferentes números de confiabilidad. Probablemente primero elija los que tengan los mejores números de confiabilidad. Con el tiempo, la brecha de confiabilidad entre jugadores con muchos juegos calificados y menos juegos podría ampliarse.
  • La manipulación de los números de calificación podría ser más fácil. Incluso el sistema ELO no es seguro, ya que algunas personas obtuvieron clasificaciones o normas de IM / GM al jugar en torneos amañados. Un buen puntaje de confiabilidad puede hacer que ayudar a los jugadores sin puntaje de confiabilidad sea muy barato: el buen jugador otorga puntos de calificación sin perder demasiado. Tan pronto como se trata de dinero, estar a salvo de trampas es un tema importante. Tengo la sensación de que el sistema de clasificación Glicko es más propenso a las manipulaciones.
  • La comunicación y la comprensión de la fuerza de juego pueden ser más difíciles para las masas. Cuando comunicas una lista de clasificación, te encuentras con problemas. Un jugador con una calificación de 2000-50 tiene una "fuerza de juego real" en algún lugar entre 1900 y 2100. Otro jugador tiene 1950-2000, lo que se traduce en un número en el rango de 1750 y 2150. Entonces el jugador con 1950-2000 de hecho, podría ser el mejor jugador, pero probablemente se clasificará por debajo del otro, solo porque jugó menos juegos o contra oponentes menos confiables. Hace que explicar su sistema de clasificación sea más difícil para las personas, sin garantizar realmente más justicia. Un GM que deja de jugar puede ganar "fuerza potencial" y alardear de su potencial de campeón mundial, porque su número de fiabilidad aumenta el margen de desviación (tenga en cuenta:

En resumen: puede obtener más de lo que esperaba, porque todo el paquete no solo incluye mejoras. Y dado que hay problemas monetarios importantes cuando miras el extremo superior de las listas de clasificación, no veo los méritos de cambiar un sistema existente.


La mayoría de las listas de clasificación tienen un límite para el puntaje de confiabilidad (RD), en lugar de tratar de usarlo para clasificar a los jugadores. Por lo tanto, un 2000 (50) siempre se clasificaría más alto que un 1950 (100). Según su calificación actual, tienen una calificación más alta, independientemente de la confiabilidad. Si el jugador de 1950 (100) ganara contra el 2000 (50), su calificación aumentaría más significativamente de lo que lo haría si fuera 1950 (50). ¿Puede describir cómo se puede engañar al sistema con Glicko con más detalle? ¿Estás hablando de saquear tu calificación si tienes un alto RD?
Eve Freeman

@West Freeman: Dudo que este sea el lugar perfecto para demostrar la relativa propensión a trampas de un sistema de calificación y solo estoy haciendo conjeturas, porque para mí parece más barato manipular el sistema, ya que no perderé tantos puntos de calificación yo mismo cuando pierdo intencionalmente contra un jugador no calificado. El punto más importante de mi respuesta es que debe verificar un sistema no solo por la equidad de cálculo, sino también por la propensión al engaño, la capacidad de comunicación, etc., antes de tirar un sistema en funcionamiento.
Ray

Pero, ¿cómo les ayuda elevar artificialmente la calificación de alguien? Por lo general, las personas que intentan jugar con el sistema intentan reducir su calificación para poder jugar en secciones más bajas y ganar el primer premio. Esto podría ser más fácil con Glicko, si evita jugar durante un largo período de tiempo y luego pierde algunos juegos que debería haber ganado. Pero combinado con pisos de calificación y el hecho de que esto solo se puede hacer de vez en cuando debido a que el RD toma tiempo para volver a subir.
Eve Freeman

1
Es posible que necesite calificaciones altas para obtener un título, recibir invitaciones o que los clubes le paguen por jugar para ellos o trabajar como entrenador. Estoy hablando del ajedrez profesional aquí y dónde está el dinero real, porque cuestionaste el comportamiento de la FIDE.
Ray
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.