Parece que está en lo correcto con su segunda suposición: la evaluación no (no puede) profundizar lo suficiente.
Es una aplicación clásica del efecto horizonte .
La reina blanca esencialmente tiene la mitad del tablero de ajedrez a su disposición para dar cheques, mientras que el rey negro no tiene refugio (la torre individual no es suficiente (pero moverla de vez en cuando restablecerá la cuenta regresiva de 3 veces) y el la reina negra está cortada) pero hay mucho espacio para correr. El peón en g5 caerá con el control en algún momento y también reiniciará la cuenta regresiva de 50 movimientos. El número de líneas aumenta exponencialmente y dado que ninguna de ellas cambia realmente nada significativo sobre la posición, Stockfish no puede podar eficientemente ninguna de ellas. Por lo tanto, el árbol de búsqueda se vuelve demasiado grande para procesarlo incluso para un motor moderno en un hardware presumiblemente bueno.
PD: Intenté y eliminé los peones blancos y el peón negro en g5 que parecen insignificantes al perpetuo a primera vista para reducir el número de piezas de ajedrez a 7, lo suficientemente bajo como para usar la base de la mesa de Lichess. Y de hecho, esa posición se gana para el negro. Sin embargo, esto no tiene sentido ya que ambas partes jugarán rápidamente movimientos que son imposibles en la posición del rompecabezas, por ejemplo, la reina blanca se moverá a a1 y el rey negro correrá hacia e3.