Actualmente estamos usando este comando dentro de un script de shell para eliminar el silencio de los archivos de audio:
ffmpeg -i $INFILE -af silenceremove=0:0:0:-1:1:${NOISE_TOLERANCE}dB -ac 1 $SILENCED_FILE -y
Esto funciona bien, excepto que elimina todo el silencio, lo que hace que el audio restante se junte.
¿Cómo se puede hacer esto dejando dos o tres segundos entre cada pieza de audio?
La solución debe ser muy eficiente, ya que procesaremos mucho audio y deberíamos usar una herramienta que se pueda instalar con bastante facilidad tanto en Linux como en OSX, como ffmpeg o sox.