Referencias sobre el algoritmo de codificación de MP3

7

¿Alguien tiene una referencia que describa el algoritmo MP3 de manera paso a paso y claro para entender?

Estas referencias fueron un poco confusas:

Compresión de audio usando la transformación de coseno discreta modificada, The MP3 Coding Standard , Joebert S. Jacaba, 2001
The Theory Behind Mp3 , Rassol Raissi, 2002

Estoy dispuesto a codificar un flujo de bits a MP3 después de leer la referencia que introduce, manualmente, para una comprensión completa del procedimiento.

— Laurent Duval
fuente

1

¿Has visto el libro "Introducción a la codificación y estándares de audio digital" de Marina Bosi y Richard Goldberg?

— Fat32

Quizás te interese esta respuesta: stackoverflow.com/a/7915379/758666

— wip el

2

Un estándar de compresión es algo bastante delicado, que tardó años en desarrollarse y ajustarse. Sugiero el análisis del algoritmo MPEG-1 Layer III (MP3) usando MATLAB , 2012 por Jayaraman J. Thiagarajan y Andreas Spanias. Después de una descripción general, lo lleva paso a paso a través de los diferentes bloques de todo el esquema, proporcionando un código de Matlab para cada uno de ellos.

— Laurent Duval
fuente

1

Los documentos que encontraste me parecen referencias bastante buenas, los he leído brevemente y seguramente querré estudiarlos a fondo, +1 por eso. Pero su pregunta no parece tener mucho sentido, o al menos no tiene una respuesta viable.

El procedimiento es extremadamente complejo (como se dio cuenta al leer los documentos) y se basa en múltiples capas de cálculo básico, transformadas de Fourier, ingeniería de audio, procesamiento de señales, etc. No puede comprender el procedimiento sin comprender el teoría.

Tampoco es humanamente posible, en términos prácticos, codificar manualmente un archivo de audio a mano. Tiene que hacer literalmente miles (probablemente cientos de miles, para una implementación completa de MP3) de operaciones aritméticas complejas solo para codificar un solo cuadro de audio de, digamos, 512 muestras. Eso es solo alrededor de 0.01 segundos de música a una frecuencia de muestreo de 44.1KHz.

¿Quizás deberías enfocar tus esfuerzos de aprendizaje en cosas menos avanzadas para empezar?

— José David
fuente