Mala evaluación de Stockfish


15

Este es el estudio

NN - NN

Como puede ver, Stockfish ofrece una victoria decisiva absoluta para el negro, ¡aunque es claramente un empate!

Compruébalo tú mismo

c4 + es un movimiento perdedor, mientras que Ba4 + es el correcto.

¿Que esta pasando? Embargo, toma en consideración no Bacalao posiciones cerrada en absoluto ?


55
Hay muchas posiciones que Stockfish no evalúa correctamente (incluidos algunos finales de juego comunes).
Qudit

10
¡Pasa todo el tiempo! Es una pieza de software, no un Dios
David

44
¡Me haría muy feliz ver un escenario en una línea similar que AlphaZero o Leela Zero evalúan completamente mal!
Leftaroundabout

1
@Qudit: Sí Solo estaba señalando que la pregunta debería centrarse precisamente en este aspecto, en lugar de comenzar desde la posición dada. Lo siento si no lo dejé claro.
TonyK

3
@leftaroundabout Leela también evalúa las fortalezas todo el tiempo, vea, por ejemplo, el final de este juego del TCEC Sufi: cd.tcecbeta.club/archive.html?season=15&div=sf&game=31 . De hecho, podría decirse que Leela evalúa aún más que Stockfish, ya que con bastante frecuencia tendrá una evaluación distinta de cero mientras que Stockfish muestra 0.00 estoicamente, y toma años antes de que Leela se dé cuenta de que el oponente no lo está dejando ganar.
Allure

Respuestas:


25

Stockfish no es una entidad perfecta para jugar al ajedrez, y has encontrado una posición en la que es incapaz de distinguir un empate (al menos hasta que la regla de 50 movimientos entre en acción y lo ayude a podar). Estas posiciones se llaman " fortalezas ". Puede decir que esto está sucediendo porque incluso si ingresa la solución, Stockfish aún evalúa la posición final como -10 o más. Estas posiciones de fortaleza donde Stockfish está completamente equivocado son pocas y distantes, pero existen, y esta es una de ellas.

Ha habido varios intentos de escribir código de detección de fortalezas en Stockfish y otros motores convencionales que están destinados a reconocer fortalezas y evitar que Stockfish se dirija hacia ellos si su posición es superior. Si tiene una idea inteligente, probablemente pueda publicarla en una revista académica (consulte las publicaciones en la wiki de programación de ajedrez).


11

Es útil comprender que los motores no salen realmente de la "estrategia", ya que miran varios movimientos hacia el futuro, evalúan el puntaje de la posición y encuentran el conjunto de movimientos óptimo.

La gran debilidad de ese enfoque es que si nada puede suceder rápidamente, el motor tendrá problemas. Esto solía ser un gran problema con los finales. Si tienes K + B + P vs K + P, no estás resolviendo esa posición en solo unos pocos movimientos. Entonces, la solución fue agregar Endbase Game Tablebases a los motores: solo la fuerza bruta calcula cada posición final del juego con anticipación y las agrega como una biblioteca para que el motor la use. (Esta es la razón por la cual, en la mayoría de las aplicaciones de ajedrez baratas, puedes ganar una victoria simplemente sobreviviendo al final del juego: porque no tiene una base de mesa de final de juego).

Pero su posición es (comprensiblemente) que no va a estar en ninguna tabla final del juego. Por lo tanto, el stockfish tiene que jugar millones de posiciones, estirando más o menos 10 movimientos hacia el futuro ... solo para descubrir que en todos ellos, el negro está sustancialmente arriba en material. Definitivamente no puede jugar ~ 56 movimientos para el árbol de decisión completo, que es lo que se necesitaría para determinar un empate definitivo.


0

Las otras respuestas cubren bien esta pregunta, pero es interesante que no todos los programas no entiendan esto es un empate. Lo conecté a mi computadora y, como miembro Premium de ChessBase, también tengo acceso a motores en la nube.

Uno de esos motores de nube evaluó esto como un empate casi instantáneamente. Solo desearía que hubiera más información que simplemente "New Engine".

ingrese la descripción de la imagen aquí

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.