Me gustaría implementar un algoritmo que sincronice dos pistas de audio.
Las dos pistas son muy similares; Puedes imaginar que son dos grabaciones de sonido (no necesariamente música) de dos micrófonos en la misma habitación. Esto significa que aparecen como una señal que pasa a través de dos canales diferentes (lineales), con un ruido aditivo diferente.
Entiendo que la primera idea podría ser buscar el pico de su correlación cruzada, pero soy particularmente interesante para encontrar literatura sobre el tema, pero todos los documentos que pude encontrar están sincronizando dos pistas musicales (usando características de audio basadas en croma) ), o sincronizando audio con una partitura. También suponen que puede haber deformación del tiempo, lo cual es una suposición innecesaria en mi caso.