Actualización de julio de 2017
Si está utilizando Unity u otro gran motor que tiene un sistema de gestión de activos, no solicite a Ogg Vorbis a sus diseñadores y compositores de sonido. Obtenga WAV o AIFF.
Unity y Unreal están estructurados para trabajar con rebotes de alta calidad y luego aplican configuraciones de compresión por plataforma. Tener el recurso fuente como Ogg o Mp3 significa que está comprimiendo dos veces el audio e introduciendo artefactos adicionales sin ningún beneficio.
Si ve que comenzar desde ogg o mp3 reduce su tamaño de construcción, esa no es una buena razón. Probablemente significa que está preexportando con configuraciones de compresión diferentes a las que ha aplicado en Unity / Unreal. ¿Hay excepciones? Sí, pero no estaría buscando esta respuesta si supiera cuándo son aplicables esas excepciones.
Si está precomprimiendo para reducir el tamaño de su repositorio, use LFS, use un sistema de control de versiones centralizado, o sonríe y aguante.
TL; DR
- Sí , MP3 320k suena genial. PERO . . .
- No use MP3, use Ogg Vorbis a 44.1kHz, calidad 6 para música. Para efectos de sonido, solo use 16 / 44.1 WAV a menos que realmente sienta que necesita recortar la grasa.
- Si tiene que usar MP3, como en Flash, intente usar 192k-256k (VBR 1 o 2), pero puede que tenga que conformarse con 128k. No vayas por debajo de 128k (VBR 6).
La verdadera respuesta
La gente dirá que MP3 320kbps no tiene pérdidas, mientras que los expertos dirán que cualquier MP3 es una mierda, pero al final, nadie escuchará una diferencia en el resultado ... a menos que estén en la industria de la música durante más de 20 años.
El audio codificado en MP3, independientemente de la calidad de codificación, siempre tiene pérdidas. Es un códec perceptual y, por lo tanto, funciona codificando las propiedades del sonido a lo largo del tiempo en ~ 1152 fragmentos de muestra en una forma comprimida, desde la cual el decodificador puede extrapolar muestras no comprimidas. Su objetivo no es recrear con precisión el audio original, solo proporcionar uno que sea "suficientemente bueno".
Sin embargo, como dijiste, 320 kbps suena muy bien. En general, se considera que es tan bueno o mejor que la calidad de CD. Sin embargo, todavía no es posible recrear perfectamente las muestras originales de un WAV sin comprimir codificado como MP3 de 320 kbps.
En general, Ogg Vorbis es un mejor formato que el MP3. En general, se acuerda brindarle una mejor calidad para el mismo tamaño de archivo, y a diferencia del MP3, se puede colocar fácilmente sin problemas. Esos fragmentos de 1152 muestras que utiliza MP3 para codificar audio a menudo dejan silencio al principio y al final de un sonido. No es un gran problema para los efectos de sonido básicos, pero es un gran problema para los bucles de música.
El IDE de Flash evita esto durante la exportación .swf, elimina el silencio manualmente. Las personas que usan transmisión de audio (o mxmlc puro) logran bucles a través de SampleDataEvent y sueltan muestras manualmente o preprocesan el archivo MP3 (consulte el blog de Andre Michelle y la utilidad CompuPhase mp3loop )
Además, el uso de un decodificador de MP3 requiere técnicamente que adquiera una licencia de patente para usar (ya que la patente de MP3 es propiedad de Technicolor, Fraunhofer y otros). Obviamente, muchas personas han lanzado juegos gratuitos que utilizan MP3, pero es mejor no perder el tiempo con eso.
¿Cuál sería el mejor formato para videojuegos y qué propiedades deberían ser suficientes (Hertz, bitrate, etc.), suponiendo que MP3 de 320 kbps sea "pesado"?
Tal vez un ejemplo o dos, cómo algunos títulos AAA funcionan con sus sonidos.
Eso depende: ¿Cuáles son sus plataformas objetivo, qué otras tecnologías está utilizando, cómo distribuye su juego y a qué estilo va? Voy a dividir esto en algunas categorías basadas en la plataforma, la tecnología y la estética.
PC de gama alta y títulos de consola
Los juegos AAA buscan una calidad de producción superior, por lo que están grabando y produciendo activos sin comprimir a 24 bits / 48 kHz (también el estándar para la postproducción de películas). Los títulos con ambiciones ligeramente menores que Battlefield 3 podrían grabar y producir en 16 / 44.1, que es el estándar oficial para audio con calidad de CD.
Por supuesto, no puedes enviar un montón de WAV sin comprimir 24/48 con un juego, sería demasiado grande. Entonces, en última instancia, debe haber algún tipo de compresión. En general, la regla general es que, si se trata de un efecto de sonido rápido como el sonido de una pistola (como el disparo del arma Portal 2 en la respuesta de Sprunth), está bien dejarlo como un WAV, posiblemente reduciendo la frecuencia de muestreo dependiendo de la frecuencia (consulte el Teorema de Nyquist , los sonidos que se componen de contenido de baja frecuencia se pueden codificar a frecuencias de muestreo más bajas). Para la música, realmente no hay forma de evitar la compresión. Ogg Vorbis con calidad de CD es el camino a seguir (44.1kHz, calidad 5-6 o superior).
Además, los juegos AAA a menudo usan una herramienta intermedia para la compresión, ya sea una herramienta interna o un middleware de audio como FMOD o Wwise. La forma en que funciona en FMOD y Wwise es que importa la mayoría de las cosas como WAV 16 / 44.1 o 24/48 (o, si el sonido es todo contenido de baja frecuencia, puede importarse con una frecuencia de muestreo más baja), luego le da FMOD un factor de compresión para cada activo, eligiendo una codificación como ADPCM, MP3 u Ogg Vorbis.
FMOD dejó de admitir recientemente la codificación de activos en los bancos de sonido que exporta desde FMOD Designer (archivos .fsb) como Ogg Vorbis a favor de un nuevo códec de Xiph llamado CELT . Ogg Vorbis puede ser un poco duro con la CPU, por lo que CELT se está desarrollando para proporcionar una alternativa. Puede cargar los archivos directamente, pero ya no los usa para codificar desde la aplicación Designer.
Por cierto, aquí hay un enlace genial sobre el audio de Battlefield Bad Company que también entra un poco en surround. DICE está a la vanguardia de la tecnología de audio en los juegos, por lo que es una buena serie para estudiar.
Además, relacionado con el sonido envolvente está el tema mono vs estéreo. En caso de que no lo supiera, todos sus efectos de sonido deberían ser mono, a menos que algunos de ellos realmente utilicen efectos de paneo. Stereo es incómodo de espacializar en un entorno 3D, y puede panoramizar sonidos en código para colocarlos en un entorno 2D.
Títulos ligeramente menos sofisticados, juegos independientes
Obviamente esto puede variar ampliamente. Un vistazo rápido muestra que Frozen Synapse utiliza archivos enteramente Ogg Vorbis, tanto para efectos de sonido como para música. Dungeons of Dredmor, por otro lado, sigue el esquema de Ogg Vorbis para música y 16 / 44.1 WAV para efectos de sonido.
El enfoque de Dungeons of Dredmor es preferible. Incluso almacenados como WAV sin comprimir, los efectos de sonido son generalmente lo suficientemente cortos como para que no ocupen tanto espacio, y ahorra muchos ciclos de CPU sin tener que decodificarlos. Desea poder cargar rápidamente un efecto de sonido en la memoria y reproducirlo. Si codifica sus efectos de sonido en Ogg Vorbis, existe la posibilidad de un pequeño retraso antes de que un jugador escuche su efecto de sonido por primera vez.
Juegos de navegador, HTML5 y Flash (con una pizca de móvil)
El audio HTML5 es un desastre. Tiene que proporcionar versiones de ogg y MP3 de sus sonidos. Codifique con la mayor calidad posible sin que su usuario se enfurezca con el largo tiempo de carga. Para MP3, no bajes de 128k, es suficientemente malo en 128.
Flash solo acepta MP3 de 16 bits / 44.1kHz a menos que se vuelva loco y escriba su propio decodificador para algún otro formato (como el decodificador experimental Ogg Vorbis en los laboratorios de Alchemy). En el pasado, Flash tenía problemas con los MP3 de velocidad de bits variable, pero nunca tuve un problema. La configuración de calidad que elija para su juego Flash dependerá de qué tan grande quiera que sea su .swf final.
Actualización: como mencionó Tetrad , los juegos móviles deben considerarse con memoria y almacenamiento. La forma en que codifica su audio para juegos móviles es muy similar a Flash, desea conservar la mayor calidad posible, pero en última instancia, debe ajustarse a un presupuesto de memoria y almacenamiento. La música de seguimiento es especialmente buena si tienes un presupuesto de almacenamiento ajustado para la música. Dígale a su compositor que limite su paleta de muestra y podrá incluir mucha más música en el juego.
Efectos de sonido y música "8-bit" o tipo Chiptune
La mayoría de los juegos harán lo que hacen Frozen Synapse y Dungeons of Dredmor. Sin embargo, probablemente pueda salirse con la suya reduciendo la frecuencia de muestreo y la profundidad de bits. No solo podría ajustarse a la estética que está buscando, sino que podría ahorrarle algo de espacio.
Además, la música de los rastreadores generalmente almacena muestras a frecuencias de muestreo bajas, solo déjelo pasar.