¿Por qué los expertos en ajedrez se sorprendieron con la victoria de AlphaZero contra Stockfish?


10

Hace poco me llamó la atención que los expertos en ajedrez tomaron el resultado de este famoso partido como algo molesto.

Ver: El nuevo mejor jugador del ajedrez es un algoritmo intrépido y audaz

Como no experto en ajedrez y ajedrez AI, mi suposición fue que, en base al rendimiento de AlphaGo, y la validación de ese tipo de método en relación con los juegos combinatorios, era que la IA más antigua no tendría ninguna posibilidad.

  • ¿Por qué fue sorprendente la victoria de AlphaZero?

Respuestas:


14

Buena pregunta.

Lo primero y más importante es que en Go deepmind no había oponentes sobrehumanos para desafiar. Los motores Go no estaban cerca del nivel más alto de los mejores jugadores humanos. En ajedrez, sin embargo, los motores son 500 puntos ELO más fuertes que los mejores jugadores humanos. Esta es una gran diferencia. La cantidad de trabajo que se ha dedicado a los motores de ajedrez contemporáneos es asombrosa. Estamos hablando de millones de horas en programación, cientos de miles de iteraciones. Es un cuerpo masivo de conocimiento y trabajo. Superar y superar todo eso en 4 horas es asombroso.

En segundo lugar, no es tanto el resultado en sí lo que sorprende a los maestros de ajedrez, sino que es cómo AlphaZero juega al ajedrez. Es bastante irónico que un sistema que no tenía conocimiento humano o experiencia juega más como nosotros. Los motores son conocidos por jugar movimientos de aspecto feo, aquellos que carecen de armonía, etc. Es difícil de explicar a un jugador que no es ajedrecista, pero existe un "movimiento artificial" como los motores contemporáneos a menudo surgen. AlphaZero no juega así en absoluto. Tiene un estilo muy humano donde domina las piezas del oponente con un juego estratégico profundo y sacrificios de posición deslumbrantes. AlphaZero juega como aspiramos, combinando una comprensión posicional profunda con la precisión de un cálculo de motores.

Editar Oh y olvidé mencionar algo sobre el resultado en sí. Si no está familiarizado con el ajedrez informático, puede que no parezca asombroso, pero lo es.

En estos días, los márgenes de victoria que separan los principales motores contemporáneos son muy delgados. En un partido de 100 juegos, podrías esperar ver un resultado como 85 juegos empatados, 9 victorias y 6 derrotas para determinar el mejor motor.

AlphaZero 28 victorias y 72 empates con cero pérdidas fue aplastante de otro mundo y era completamente impensable hasta el momento en que sucedió.


Buena respuesta. Su punto sobre la comparación entre el ajedrez re de AI es interesante en términos de la limitación basada en la locura del ajedrez y la tríada Ganar / Perder / Empatar. (Posiblemente, en el futuro, necesitaremos juegos finitos e intratables que permitan un análisis más granular en términos de resultados). Estoy familiarizado con la historia de los motores de Ajedrez, y la enorme cantidad de esfuerzo y conocimiento humano que se empleó en ellos, pero El contexto de la falta de éxito es: el 19x19 Go, mucho más complejo, tenía una ramificación opuesta para mí.
DukeZhou

Específicamente, mi suposición era que si AlphaGo podía vencer a los mejores humanos en el juego significativamente más complejo, parecía razonable que vencería no solo a los mejores humanos, sino a las principales IA anteriores en cualquier otro juego.
DukeZhou

La parte sobre los movimientos artificiales es bastante importante, y no es algo de lo que he visto hablar a jugadores que no son ajedrecistas. +1
Stella Biderman

4

MCTS para el ajedrez había sido probado en la literatura con poco éxito. Se asumió que el enfoque de AlphaGo nunca funcionaría en el ajedrez, tal vez en Go pero no en ajedrez. De repente, Google anunció que el enfoque estaba funcionando y estaba superando al programa de ajedrez más fuerte del mundo por un margen muy significativo.

Antes de Google, a todos los programadores de ajedrez se les enseñaba que elaborar heurísticas en programación de motores era una mejor estrategia que el aprendizaje automático. No importa cómo implementó las redes neuronales, nunca habría corrido más rápido que un montón de instrucciones de paneles de bits de 64 bits. AlphaGo funcionaba bastante lento , pero jugaba al ajedrez más fuerte.


2

Veo, en base a los artículos que proporciona, muchos niveles de sorpresa en la victoria:

El ajedrez es un juego difícil de dominar y la contraparte tenía las mejores prácticas del mundo, AlphaZero tenía tabula rasa.

El aprendizaje tomó cuatro horas y AlphaZero no perdió ningún partido de 100.

El estilo de juego era una mezcla alienígena de movimientos humanos y de computadora, agresivos y algunas veces parecían tontos con sacrificios que no tienen idea, pero que en realidad están fortaleciendo el estado futuro.

La cantidad de posibilidades tomadas en cuenta por movimiento fue menor que la contraparte, AlphaZero tenía un misterioso instinto o intuición.

La sensación de malestar provino de la cantidad de material de entrenamiento con el que AlphaZero se había construido y el límite de tiempo, que tal vez no le dio a la máquina tradicional una buena cantidad de tiempo.


Aaah Entonces, surgió de la falta de confianza en el nuevo método de IA. Eso tiene sentido.
DukeZhou
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.