Tengo algunas imágenes 4K 3840x2160 en formato MP4 que necesito reducir a 1080p. Intenté correr
ffmpeg -i orig.mp4 -vf scale=1920:1080 smaller.mp4
pero el resultado es de muy baja calidad, con toda la imagen compuesta de "mosaicos" cuadrados como si estuviese ampliando 4: 1.
Aquí está el resultado de ejecutar este comando:
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'origs/P1000003.MP4':
Metadata:
major_brand : mp42
minor_version : 1
compatible_brands: mp42avc1
creation_time : 2015-02-19 17:10:38
Duration: 00:05:14.48, start: 0.000000, bitrate: 95903 kb/s
Stream #0.0(und): Video: h264 (High), yuvj420p, 3840x2160 [PAR 1:1 DAR 16:9], 95792 kb/s, 25 fps, 25 tbr, 90k tbn, 50 tbc
Metadata:
creation_time : 2015-02-19 17:10:38
Stream #0.1(und): Audio: aac, 48000 Hz, stereo, s16, 125 kb/s
Metadata:
creation_time : 2015-02-19 17:10:38
Incompatible pixel format 'yuvj420p' for codec 'mpeg4', auto-selecting format 'yuv420p'
[buffer @ 0x22a3420] w:3840 h:2160 pixfmt:yuvj420p
[scale @ 0x22a3ce0] w:3840 h:2160 fmt:yuvj420p -> w:1920 h:1080 fmt:yuv420p flags:0x4
Output #0, mp4, to '1-short.mp4':
Metadata:
major_brand : mp42
minor_version : 1
compatible_brands: mp42avc1
creation_time : 2015-02-19 17:10:38
encoder : Lavf53.21.1
Stream #0.0(und): Video: mpeg4, yuv420p, 1920x1080 [PAR 1:1 DAR 16:9], q=2-31, 200 kb/s, 25 tbn, 25 tbc
Metadata:
creation_time : 2015-02-19 17:10:38
Stream #0.1(und): Audio: libvo_aacenc, 48000 Hz, stereo, s16, 200 kb/s
Metadata:
creation_time : 2015-02-19 17:10:38
Stream mapping:
Stream #0.0 -> #0.0
Stream #0.1 -> #0.1
Press ctrl-c to stop encoding
frame= 125 fps= 6 q=31.0 Lsize= 968kB time=5.00 bitrate=1586.7kbits/s
video:842kB audio:123kB global headers:0kB muxing overhead 0.421047%
Sé por experiencia que ffmpeg es una herramienta excelente, por lo que debo estar arruinando las opciones / parámetros de alguna manera ...
¿Cómo puedo hacer esto?
-c:a copy
, ya que no desea o no necesita volver a codificar la transmisión de audio. Úselo -map 0
para copiar los metadatos de cualquier capítulo u otras cosas. (ffmpeg solo toma 1 vid + 1 aud por defecto.)
-sws_flags lanczos+print_info
usará un algoritmo de escala mejor que el predeterminado (creo que bilineal). La respuesta de stlb cubre la parte de codificación de video del proceso.
scale=1920:-2:flags=lanczos
. También iba a mencionar la -2
escala for en mi respuesta inexistente. Para aquellos que no lo saben, puede poner el -2
ancho o la altura, y proporcionará automáticamente el valor correcto mientras conserva la relación de aspecto y hace que el valor sea divisible por 2 (requerido por libx264 para salidas yuv420p).
-t 10
para hacer una salida de 10 segundos. ¿Por qué quieres reducir? ¿Cuál es el caso de uso para su salida escalada? Esta información me ayudará a proporcionar una respuesta más precisa.