HTTP no funciona así. El cliente envía una solicitud, luego el servidor devuelve una respuesta. No se produce otra comunicación. Bueno, el servidor puede enviar respuestas informativas 1xx antes de la respuesta principal. Pero no hay forma de que el cliente envíe actualizaciones sobre una solicitud enviada.
(La situación es muy diferente para HTTP / 2 que puede multiplexar múltiples solicitudes a través de la misma conexión. Un cliente puede CANCELAR una secuencia para indicar que ya no es necesaria después de recibir un PUSH_PROMISE del servidor. Ignoraré HTTP / 2 por el resto de esta respuesta.)
Además, las redes no funcionan así. En particular, vea la segunda falacia de la computación distribuida : "la latencia es cero". No lo es. De ese tiempo de espera de un segundo, es posible que se hayan gastado 400 ms en establecer la conexión y enviar la solicitud y 600 ms en la respuesta, porque uno de los paquetes se descartó y tuvo que reenviar todo y su cliente está en Australia. Además del problema de que el servidor podría no tener suficiente tiempo, el servidor ni siquiera sabe cuánto tiempo tiene porque la latencia de respuesta no se puede conocer de antemano.
Entonces, dado que, literalmente, implementar estos tiempos de espera es imposible, ¿qué tipo de solución podría ser lo suficientemente buena?
Si la respuesta no tendrá valor después del tiempo de espera, el cliente puede simplemente cerrar la conexión. Esto hará que su respuesta sea ignorada, pero no impedirá la respuesta.
Cerrar la conexión TCP a través de la cual se envía la solicitud HTTP notifica al servidor. Pero esta notificación solo llega con latencia, por lo que puede ser demasiado tarde. Además, su marco web puede no estar haciendo nada cuando el socket del cliente está cerrado. En ese caso, solo obtendrá un error "restablecimiento de la conexión por igual" una vez que intente escribir en el socket cerrado.
Si no desea dedicar más de un segundo al procesamiento de la respuesta, la implementación de ese tiempo de espera es totalmente su responsabilidad y no tiene nada que ver con las redes o HTTP.
Puede pedirle al cliente que proporcione un tiempo de espera para el servidor, de modo que el servidor pueda abortar si no puede cumplir con la fecha límite. Esto podría especificarse como un encabezado personalizado o como un parámetro de consulta en la URL. Este plazo debe ser un punto absoluto en el tiempo y no una duración para que los retrasos en la transmisión también consuman el tiempo disponible. Pero la precisión por debajo del segundo es difícil: el servidor y el cliente deben sincronizarse con la hora correcta y deben usar un reloj adecuado. Dependiendo de la configuración, cada fuente de tiempo puede estar apagada en 100 ms, incluso cuando está configurada correctamente. Esto ya consume una parte significativa de su presupuesto de tiempo.