Ahora, me gustaría mostrar qué frecuencias tiene el discurso. Sin embargo, no estoy seguro de cuál sería la mejor manera de hacerlo. Parece que a veces se calcula el valor absoluto de una transformada de Fourier y, a veces, la densidad espectral de potencia.
Si desea asignar un significado físico a su análisis, vaya con la densidad espectral de potencia (PSD). Esto se debe a que esto simplemente le dará el poder de su señal, en cada banda de frecuencia. Por otro lado, si no quiere / no le importa un significado físico, pero quiere saber cómo varían las amplitudes de Fourier de cada banda entre sí, puede apegarse a la magnitud absoluta.
x[n]X(f)|X(f)||X(f)|2
Si entiendo correctamente, este último funciona para que divida mi señal en partes, haga FFT parte por parte y de alguna manera las sume. Las funciones de la ventana están involucradas de alguna manera. ¿Puedes aclararme esto un poco? Soy nuevo en DSP.
No, esto no es verdad. Lo que está hablando aquí se refiere a la Transformada de Fourier de corto tiempo (STFT). Esto es simplemente cortar su señal de dominio de tiempo, viudarla y luego tomar la forma trnas de Fourier. Al final del día, aún tendrá una matriz compleja. Si elige tomar su magnitud absoluta, tendrá una matriz de transformación de Fourier de magnitud absoluta. Si toma su magnitud absoluta al cuadrado, tendrá una matriz de densidad espectral de potencia.