¿Q2 está siempre apagado?
No, siempre está encendido. Lo que Q2 hace es que intenta hacer que una corriente (pequeña) fluya hacia su colector. Esa corriente intenta bajar el voltaje en Vout.
Q5, Q2 y R2 son una especie de espejo actual pero uno malo. La corriente a través de R3 no se copia de 1 a 1 como en un espejo de corriente "adecuado". En cambio, dado que R2 está presente, la corriente a través de Q2 será mucho más pequeña que la corriente a través de R3 y Q5. A través de R3 obtenemos un voltaje bastante constante de VEE - 0.7 V. Como R3 es 1 kohm, la corriente a través de R3 será un par de mA. Como se dijo, la corriente a través de Q2 será menor que eso, como 100 uA o menos (100uA es solo mi suposición, es demasiado trabajo hacer que sea un número más preciso, eso no importa de todos modos para explicar cómo funciona el circuito). Ese 100uA hace que el Vbe de Q5 no sea 0.7 V sino un poco más pequeño como 0.6 V (= 0.7 V - 100 mV, ya que 100 uA a través de R2 dan 100 mV).
Esos 100 uA derriban a Vout. Enfrente está Q1 tirando de la salida hacia arriba (a través de R1). Si Vin es lo suficientemente alto, Q1 puede suministrar tanta corriente que Vout se detendrá, casi al valor de VCC.
Cuando Vin tiene un voltaje muy bajo, Q1 se abrirá mucho menos, suministrando mucha menos corriente, de modo que Q2 "gana" y Vout es derribado.
Q5 está conectado en modo diodo, y su Vbe está fijado a 0.7V
Correcto
Agregar Q2 Vbe más la caída de voltaje en R2 debería dar 0.7V nuevamente
De hecho Vbe (Q2) + V (R2) = Vbe (Q5) = 0.7 V
Lo que sucederá allí es que habrá una corriente significativamente más pequeña que fluye a través de Q2, R2 que la que fluye a través de Q5.
Lo anterior implica que el Vbe de Q2 es menor que 0.7 O que el dropo de voltaje en R2 es cero.
Ambas son ciertas, Vbe (Q2) será un poco menos de 0.7 V y habrá una pequeña caída de voltaje (menos de 100 mV) en R2.