tl; dr: Se llaman hilos porque "hilo" es una metáfora adecuada.
Cuando inicia un hilo, confía en el sistema operativo para asignar el tiempo de procesamiento para que su hilo pueda ejecutarse. Mientras se ejecuta su hilo, el procesador (o núcleo) está poniendo toda su atención en su hilo. Cuando el sistema operativo cambia el núcleo a un subproceso diferente, el subproceso deja de ejecutarse mientras se repara el otro subproceso.
Entonces la ejecución salta por todos lados. Pero la integridad del conjunto de instrucciones de la máquina permanece intacta, a pesar de estos saltos, porque construimos cercas y mecanismos de concurrencia para proteger su estado y el estado de los objetos con los que interactúa.
Entonces, el hilo se refiere, no a la ejecución de instrucciones en un hilo particular, sino a las instrucciones que eventualmente se ejecutarán dentro del hilo que hemos creado. En otras palabras, cada subproceso puede considerarse como una máquina o agente individual (los llamamos procesos ligeros), sin tener que pensar en todos los cambios de contexto que realiza el sistema operativo para dar la apariencia de que todos ejecutando simultáneamente.
En otras palabras, a pesar de todos los saltos que hace el sistema operativo detrás de escena, lo que llamamos un hilo (la secuencia de operaciones que estamos ejecutando en un proceso ligero) todavía puede considerarse como la misma secuencia de operaciones, si no hubiéramos generado el hilo, asumiendo que hemos tomado las protecciones de concurrencia necesarias.
Si esta descripción parece demasiado pesada y abstracta, entonces piense en un hilo en un foro, como Reddit. Puede ramificar nuevas discusiones; cada discusión es su propio hilo. Puede saltar de un lado a otro entre hilos. Pero cada hilo aún mantiene su integridad estructural como una conversación individual.