Dado que los humanos carecen de la capacidad de buscar en profundidad, como los programas tradicionales de ajedrez informático (fritz, stockfish y otros), crean 'principios estratégicos' o reglas básicas (control central, desarrollo, seguridad del rey) y conceptos o trucos que son aplicables en una gran variedad de situaciones de diferentes maneras, como sacrificio, torres conectadas, par de alfil, finales específicos, por ejemplo, cómo arrinconar al rey con una torre y un peón.
Creo que alpha zero ha reinventado independientemente muchos de estos conceptos (percepciones y conceptos) y también ha aprendido toneladas de otros nuevos, porque no era necesario que su conocimiento se construyera sobre funciones de evaluación humana y la fuerte búsqueda minmax que siempre asume que el oponente es un genio.
Por supuesto, tales principios en sí mismos entran en conflicto en algunas situaciones, es por eso que varias jugadas de apertura y trampas se estudian cuidadosamente, por ejemplo, no desarrolles reina demasiado pronto.
Por otro lado, los humanos también notan que una vez que pierdes una pieza (sin cambio) debilitas tus fuerzas, por lo que tienen mucho cuidado de no perder una pieza sin una compensación.
Creo que el juego de Alphazero ha liberado el ajedrez informático (y el ajedrez humano) del miedo servil de perder material pequeño y la excesiva dependencia de la apertura de libros y valores de piezas.
Los juegos de Alphazero muestran cosas como los 'principios estratégicos' como control central, desarrollo, espacio, iniciativa, son mucho más importantes si tu oponente es descuidado. En otras palabras, 'sacrificio' no es realmente sacrificio sino intercambiar una pieza por ganancia en iniciativa, posición, movimiento dirigido.
Alphago (no el cero) se basó en la evaluación humana, pero alphazero configura toda la cadena de evaluación para 'buscar o simular' como un único proceso de extremo a extremo y presenta una forma de juego totalmente nueva.
Si lo piensas bien, los grandes maestros del pasado como Morphy, Fischer, Kasparov han sido aplaudidos por este tipo de juego, por lo general, intuitivo, donde no están limitados por la evaluación escrita aprovechando situaciones especiales que surgir. Creo que los juegos de alpha zero tienen ese factor 'wow'.
Por qué las redes neuronales. Mientras que los programas de computadora que usan representación simbólica y búsqueda discreta solo pueden usar 'una' forma de pensar, las redes neuronales pueden procesar situaciones paralelas con evaluaciones alternativas y conflictivas y pasar a la vista más valiosa en las capas posteriores.