¿De qué calidad deberían ser mis sonidos?


33

El sonido y su calidad es algo así como la religión. Historia de nunca acabar.

La gente dirá que MP3 320kbps no tiene pérdidas, mientras que los expertos dirán que cualquier MP3 es una mierda, pero al final, nadie escuchará una diferencia en el resultado ... a menos que estén en la industria de la música durante más de 20 años.

¿Cuál sería el mejor formato para videojuegos y qué propiedades deberían ser suficientes (Hertz, bitrate, etc.), suponiendo que MP3 de 320 kbps sea "pesado"?

Tal vez un ejemplo o dos, cómo algunos títulos AAA funcionan con sus sonidos.


3
Los expertos que escuchan la diferencia entre 320kbps MP3 y una grabación sin pérdidas generalmente tienen una configuración de alta fidelidad (muy) costosa que les permite incluso escuchar estas diferencias. No es algo que tenga en su PC o dispositivo móvil habitual. También jugar un juego es algo diferente a escuchar música. Hay otras cosas que su cerebro está ocupado con que pensar en la calidad de audio por debajo del par;)
bummzack

2
@bummzack, sí, siempre y cuando la calidad del audio no sea tan pobre que distraiga. A veces encuentro juegos que tienen efectos de sonido realmente pobres que tienen un silbido de fondo o están comprimidos de manera increíble. Sin embargo, poner casi cualquier consideración en la calidad de audio probablemente evitará esto. Le sugiero que pruebe sus muestras en algo con audio de gama alta. Su codificación de audio no es el único factor que conduce a un buen audio.
user606723

La única razón por la que estoy en contra de MP3 es porque se repite terriblemente.
Sidar

Respuestas:


63

Actualización de julio de 2017

Si está utilizando Unity u otro gran motor que tiene un sistema de gestión de activos, no solicite a Ogg Vorbis a sus diseñadores y compositores de sonido. Obtenga WAV o AIFF.

Unity y Unreal están estructurados para trabajar con rebotes de alta calidad y luego aplican configuraciones de compresión por plataforma. Tener el recurso fuente como Ogg o Mp3 significa que está comprimiendo dos veces el audio e introduciendo artefactos adicionales sin ningún beneficio.

Si ve que comenzar desde ogg o mp3 reduce su tamaño de construcción, esa no es una buena razón. Probablemente significa que está preexportando con configuraciones de compresión diferentes a las que ha aplicado en Unity / Unreal. ¿Hay excepciones? Sí, pero no estaría buscando esta respuesta si supiera cuándo son aplicables esas excepciones.

Si está precomprimiendo para reducir el tamaño de su repositorio, use LFS, use un sistema de control de versiones centralizado, o sonríe y aguante.


TL; DR

  1. , MP3 320k suena genial. PERO . . .
  2. No use MP3, use Ogg Vorbis a 44.1kHz, calidad 6 para música. Para efectos de sonido, solo use 16 / 44.1 WAV a menos que realmente sienta que necesita recortar la grasa.
  3. Si tiene que usar MP3, como en Flash, intente usar 192k-256k (VBR 1 o 2), pero puede que tenga que conformarse con 128k. No vayas por debajo de 128k (VBR 6).

La verdadera respuesta

La gente dirá que MP3 320kbps no tiene pérdidas, mientras que los expertos dirán que cualquier MP3 es una mierda, pero al final, nadie escuchará una diferencia en el resultado ... a menos que estén en la industria de la música durante más de 20 años.

El audio codificado en MP3, independientemente de la calidad de codificación, siempre tiene pérdidas. Es un códec perceptual y, por lo tanto, funciona codificando las propiedades del sonido a lo largo del tiempo en ~ 1152 fragmentos de muestra en una forma comprimida, desde la cual el decodificador puede extrapolar muestras no comprimidas. Su objetivo no es recrear con precisión el audio original, solo proporcionar uno que sea "suficientemente bueno".

Sin embargo, como dijiste, 320 kbps suena muy bien. En general, se considera que es tan bueno o mejor que la calidad de CD. Sin embargo, todavía no es posible recrear perfectamente las muestras originales de un WAV sin comprimir codificado como MP3 de 320 kbps.

En general, Ogg Vorbis es un mejor formato que el MP3. En general, se acuerda brindarle una mejor calidad para el mismo tamaño de archivo, y a diferencia del MP3, se puede colocar fácilmente sin problemas. Esos fragmentos de 1152 muestras que utiliza MP3 para codificar audio a menudo dejan silencio al principio y al final de un sonido. No es un gran problema para los efectos de sonido básicos, pero es un gran problema para los bucles de música.

El IDE de Flash evita esto durante la exportación .swf, elimina el silencio manualmente. Las personas que usan transmisión de audio (o mxmlc puro) logran bucles a través de SampleDataEvent y sueltan muestras manualmente o preprocesan el archivo MP3 (consulte el blog de Andre Michelle y la utilidad CompuPhase mp3loop )

Además, el uso de un decodificador de MP3 requiere técnicamente que adquiera una licencia de patente para usar (ya que la patente de MP3 es propiedad de Technicolor, Fraunhofer y otros). Obviamente, muchas personas han lanzado juegos gratuitos que utilizan MP3, pero es mejor no perder el tiempo con eso.

¿Cuál sería el mejor formato para videojuegos y qué propiedades deberían ser suficientes (Hertz, bitrate, etc.), suponiendo que MP3 de 320 kbps sea "pesado"?

Tal vez un ejemplo o dos, cómo algunos títulos AAA funcionan con sus sonidos.

Eso depende: ¿Cuáles son sus plataformas objetivo, qué otras tecnologías está utilizando, cómo distribuye su juego y a qué estilo va? Voy a dividir esto en algunas categorías basadas en la plataforma, la tecnología y la estética.

PC de gama alta y títulos de consola

Los juegos AAA buscan una calidad de producción superior, por lo que están grabando y produciendo activos sin comprimir a 24 bits / 48 kHz (también el estándar para la postproducción de películas). Los títulos con ambiciones ligeramente menores que Battlefield 3 podrían grabar y producir en 16 / 44.1, que es el estándar oficial para audio con calidad de CD.

Por supuesto, no puedes enviar un montón de WAV sin comprimir 24/48 con un juego, sería demasiado grande. Entonces, en última instancia, debe haber algún tipo de compresión. En general, la regla general es que, si se trata de un efecto de sonido rápido como el sonido de una pistola (como el disparo del arma Portal 2 en la respuesta de Sprunth), está bien dejarlo como un WAV, posiblemente reduciendo la frecuencia de muestreo dependiendo de la frecuencia (consulte el Teorema de Nyquist , los sonidos que se componen de contenido de baja frecuencia se pueden codificar a frecuencias de muestreo más bajas). Para la música, realmente no hay forma de evitar la compresión. Ogg Vorbis con calidad de CD es el camino a seguir (44.1kHz, calidad 5-6 o superior).

Además, los juegos AAA a menudo usan una herramienta intermedia para la compresión, ya sea una herramienta interna o un middleware de audio como FMOD o Wwise. La forma en que funciona en FMOD y Wwise es que importa la mayoría de las cosas como WAV 16 / 44.1 o 24/48 (o, si el sonido es todo contenido de baja frecuencia, puede importarse con una frecuencia de muestreo más baja), luego le da FMOD un factor de compresión para cada activo, eligiendo una codificación como ADPCM, MP3 u Ogg Vorbis.

FMOD dejó de admitir recientemente la codificación de activos en los bancos de sonido que exporta desde FMOD Designer (archivos .fsb) como Ogg Vorbis a favor de un nuevo códec de Xiph llamado CELT . Ogg Vorbis puede ser un poco duro con la CPU, por lo que CELT se está desarrollando para proporcionar una alternativa. Puede cargar los archivos directamente, pero ya no los usa para codificar desde la aplicación Designer.

Por cierto, aquí hay un enlace genial sobre el audio de Battlefield Bad Company que también entra un poco en surround. DICE está a la vanguardia de la tecnología de audio en los juegos, por lo que es una buena serie para estudiar.

Además, relacionado con el sonido envolvente está el tema mono vs estéreo. En caso de que no lo supiera, todos sus efectos de sonido deberían ser mono, a menos que algunos de ellos realmente utilicen efectos de paneo. Stereo es incómodo de espacializar en un entorno 3D, y puede panoramizar sonidos en código para colocarlos en un entorno 2D.

Títulos ligeramente menos sofisticados, juegos independientes

Obviamente esto puede variar ampliamente. Un vistazo rápido muestra que Frozen Synapse utiliza archivos enteramente Ogg Vorbis, tanto para efectos de sonido como para música. Dungeons of Dredmor, por otro lado, sigue el esquema de Ogg Vorbis para música y 16 / 44.1 WAV para efectos de sonido.

El enfoque de Dungeons of Dredmor es preferible. Incluso almacenados como WAV sin comprimir, los efectos de sonido son generalmente lo suficientemente cortos como para que no ocupen tanto espacio, y ahorra muchos ciclos de CPU sin tener que decodificarlos. Desea poder cargar rápidamente un efecto de sonido en la memoria y reproducirlo. Si codifica sus efectos de sonido en Ogg Vorbis, existe la posibilidad de un pequeño retraso antes de que un jugador escuche su efecto de sonido por primera vez.

Juegos de navegador, HTML5 y Flash (con una pizca de móvil)

El audio HTML5 es un desastre. Tiene que proporcionar versiones de ogg y MP3 de sus sonidos. Codifique con la mayor calidad posible sin que su usuario se enfurezca con el largo tiempo de carga. Para MP3, no bajes de 128k, es suficientemente malo en 128.

Flash solo acepta MP3 de 16 bits / 44.1kHz a menos que se vuelva loco y escriba su propio decodificador para algún otro formato (como el decodificador experimental Ogg Vorbis en los laboratorios de Alchemy). En el pasado, Flash tenía problemas con los MP3 de velocidad de bits variable, pero nunca tuve un problema. La configuración de calidad que elija para su juego Flash dependerá de qué tan grande quiera que sea su .swf final.

Actualización: como mencionó Tetrad , los juegos móviles deben considerarse con memoria y almacenamiento. La forma en que codifica su audio para juegos móviles es muy similar a Flash, desea conservar la mayor calidad posible, pero en última instancia, debe ajustarse a un presupuesto de memoria y almacenamiento. La música de seguimiento es especialmente buena si tienes un presupuesto de almacenamiento ajustado para la música. Dígale a su compositor que limite su paleta de muestra y podrá incluir mucha más música en el juego.

Efectos de sonido y música "8-bit" o tipo Chiptune

La mayoría de los juegos harán lo que hacen Frozen Synapse y Dungeons of Dredmor. Sin embargo, probablemente pueda salirse con la suya reduciendo la frecuencia de muestreo y la profundidad de bits. No solo podría ajustarse a la estética que está buscando, sino que podría ahorrarle algo de espacio.

Además, la música de los rastreadores generalmente almacena muestras a frecuencias de muestreo bajas, solo déjelo pasar.


Efectos de sonido explicados. Período.
joltmode

1
¿Tiene un enlace para afirmar que FMOD está dejando de admitir Ogg Vorbis?
Kylotan

1
Debo aclarar que no dejaron de apoyar a Ogg Vorbis. Simplemente ya no está disponible al elegir un códec para activos en FMOD Designer (respuesta actualizada para reflejar esto). No hicieron grandes anuncios al respecto, lo descubrí cuando fui a tratar de codificar algo de música en un banco de sonido como Ogg Vorbis. La publicación de KVR lo menciona: kvraudio.com/news/… Pero podría descargar FMOD Designer con la misma facilidad y verlo usted mismo.
michael.bartnett

1
@emddudley Si su audio de origen es algo loco como 48 bits / 196 kHz, entonces posiblemente podría comprimirlo de tal manera que conserve la cantidad increíble de información de frecuencia y amplitud y, como tal, sea de mayor fidelidad que el audio de CD, que se fija en 16 bits / 44,1 kHz.
michael.bartnett

1
@DavidDimalanta WAV es generalmente mucho más grande que MP3, pero con la ventaja de que no tiene que decodificarlo, simplemente póngalo en la memoria. La música de fondo generalmente se comprime por este motivo, ya que el audio almacenado se alarga y el tamaño aumenta rápidamente. Sin embargo, MP3 tiene problemas con las licencias y el bucle continuo, como mencioné en la respuesta anterior, así que mejor evítelo si puede.
michael.bartnett

14

Cómo funciona la industria con el sonido, no estoy seguro.

Pero mirando a través de mis juegos, la mayoría de ellos lo envuelven en algún archivo de datos o de otra manera.

Aquí hay algunos bits de audio que podría extraer:

  • Deus Ex: Human Revolution (Menú principal [canción]) mp3 44100Hz 320kb / s
  • Portal 2 (4000 grados Kelvin [canción]) mp3 44100Hz 128kb / s
  • Portal 2 (Portal Gun fizzle [soundfx]) wav 44100Hz 16bits / sample
  • Facciones de riesgo ("NORMALLOOP_SEGMENT03" [soundfx]) ogg 48000Hz 128kb / s
  • Call of Juarez Bound in Blood ("COJ2_Attack_16" [canción]) ogg 48000Hz 350kb / s
  • Zombie Driver ("pickup_money" [soundfx], "main_menu" [canción]) ogg 44100Hz 128kb / s
  • X3 Terran Conflict ("00025" [canción]) mp3 22050Hz 56kb / s
  • Bejeweled 3 ("Coastal" [ambiente]) ogg 44100Hz 96kb / s

Como no pude descomprimir ninguno de los archivos dat, etc. (excepto el GCF de Portal 2), los resultados pueden no mostrar el espectro en el mercado. Traté de darle una muestra de juegos, y estos que no empaquetan su audio parecen mostrar resultados similares.


4000 Degrees Kelvines del primer portal, no del segundo.
Val dice Reinstate Monica

6

En mi experiencia (principalmente títulos móviles), la calidad de audio debe ser lo más baja posible sin efectos secundarios negativos para que tenga más memoria para otras cosas.

Tenga en cuenta que el hecho de que haya compresión implicada no significa necesariamente que su calidad sea demasiado baja. Su audiencia no va a hacer comparaciones lado a lado con los sonidos básicos como usted, por lo que si se están perdiendo algo a través de la compresión con pérdida, generalmente no lo sabrán.

Por ejemplo, debe preguntarse si hay alguna razón para usar sonidos estéreo o música. ¿El efecto que te da vale casi el doble de la sobrecarga? Para la música, dependiendo de cómo esté escrita, la respuesta podría ser sí. Algunos motores ni siquiera admiten fuentes estéreo para efectos de sonido. Ese tipo de cosas.

Donde está esa línea es muy subjetiva, por supuesto. Hay otras respuestas que entran en reglas generales más específicas.

Lo importante es tener estándares, establecerlos temprano e intentar cumplirlos. Si está creando música para un juego y tiene que alcanzar la mitad de su tasa de bits para que quepa en la memoria, entonces estará mucho peor que si establece un nivel de baja calidad en primer lugar.


4

Si está apuntando a una plataforma específica (iPhone, Xbox 360, PS3), debe investigar si el hardware tiene un decodificador de audio. Si es así, debes usarlo. Ahorrará tiempo de CPU (¡y duración de la batería!) Al descargar el audio, y podrá aprovechar al máximo las API de esa plataforma. Más importante aún, esa aceleración de hardware dependerá de que su audio esté en un formato específico, por lo que su elección ya estará hecha.

Sin embargo, si está apuntando a PC, sus opciones son más variadas. Simplemente elegiría el formato con el tamaño de archivo más pequeño que todavía suena bien para sus oídos, y lo ejecutaría.


¿Puedes ser un poco más específico sobre las diferentes consolas?
Quazi Irfan

La idea principal es apuntar a los diferentes sistemas operativos de PC, sí. * NIX (incluida Mac), Windows. Pero luego se expandirá a iOS, Android. Consolas a un lado por ahora.
joltmode

4

Depende de lo que va a "oscurecer" la codificación con pérdida: si observa la respuesta de Sprunth, la tendencia general de la música es de alta calidad para el menú y de baja calidad para la música del juego. La razón es probablemente porque:

  • En los menús, el único sonido que se reproduce es la música y, por lo tanto, está "enfocado"; notarías las tasas de bits más bajas con pérdida.
  • En el juego tienes los efectos de sonido (explosiones, etc.) además de la música que se reproduce a un volumen más bajo; lo que significa que no notarías la pérdida de calidad.
  • La llamada de los desarrolladores de Juárez parece gustarle demasiado.

Finalmente, otra tendencia de sus respuestas es que la mayoría de los efectos son 44KHz / 16bit; pero algunos juegos más antiguos le permitían correr a 22KHz / 16bit ('Calidad de sonido'); en caso de que su tarjeta de sonido no pudiera manejar la frecuencia de muestreo más alta.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.