Hace 40 años, podría haber tenido una computadora donde la CPU controlaba el altavoz directamente. Esos tiempos terminaron hace mucho tiempo.
Es posible que tenga una computadora con una tarjeta de sonido primitiva. Dicha tarjeta de sonido tendrá un búfer para muestras de audio estéreo, ese búfer se puede llenar, se iniciará la función de salida y la tarjeta de sonido comenzará a generar audio a partir de las muestras en sus búferes, sin que la CPU tenga que hacer nada. Todo lo que necesita hacer la CPU es llenar los búferes con más muestras de audio antes de que se agote. Si tiene un búfer de un megabyte, son 250,000 muestras estéreo en calidad de CD, eso es aproximadamente seis segundos. Entonces, cada pocos segundos, la CPU tiene que llenar estos búferes nuevamente.
En realidad, su computadora tendrá algo mucho más avanzado. En principio, lo mismo, pero las memorias intermedias se pueden llenar directamente con sonido en formato mp3 o aac, por ejemplo, y la tarjeta de sonido decodificará estos datos en muestras estéreo por sí misma. Lo más probable es que se pueda programar para producir todo tipo de efectos diferentes, desde el volumen del sonido, mejorando la calidad del sonido, cambiando el tono o la velocidad de forma independiente, generando sonido envolvente, etc.
La CPU no hace mucho, solo llena los búferes de sonido de vez en cuando. El resto lo hace otra cosa. Por supuesto, cuando digo "tarjeta de sonido", estos se han reducido de tarjetas de sonido a chips a una pequeña cantidad de transistores en un chip masivo con muchas funcionalidades diferentes.
Para un fabricante de tales tarjetas, mire https://en.wikipedia.org/wiki/Wolfson_Microelectronics como punto de partida.