Tengo un conjunto de canciones para las cuales extraje STFT (Short-Time Fourier Transform) y utilicé el espectro de magnitud para calcular el espectrograma de mel utilizando una matriz de banco de filtros de mel , entonces . Quiero saber si hay algún método para revertir este proceso, es decir, convertir del espectrograma mel nuevamente al espectrograma. Realicé una reducción de dimensionalidad en el espectrograma de mel y reconstruí el espectrograma de mel de dimensiones más bajas. Ahora quiero regenerar la señal de audio del espectrograma reconstruido, así que supongo que primero reconstruir el espectrograma y luego la señal de audio.
El problema es que la matriz del banco de filtros de mel no es una matriz cuadrada, ya que reducimos el no de los contenedores de frecuencia, por lo que es inverso no se puede usar así: . Entonces, ¿hay alguna forma de generar el mapeo inverso, como alguna función de transferencia inversa que puede convertir de a ?