简短版本:使用 ffmpeg 的管道输出会生成元数据不正确的文件。
ffmpeg -y -i .\test_mp4.mp4 -f avi -c:v libx264 - > output.avi
使用管道输出制作 AVI 文件。
ffprobe -v error -count_frames -show_entries stream=duration,nb_read_frames,r_frame_rate .\output.avi
输出将显示元数据与视频中包含的实际帧不匹配。
详情如下。
使用Python,我尝试使用ffmpeg来压缩视频并将它们放入PowerPoint中。这很好用,但是,视频文件本身的帧计数不正确,当我从其他代码中读取这些视频时,这可能会导致问题。
编辑澄清:“帧计数”是指元数据帧计数。视频中包含的实际帧数是正确的,但查询元数据给出的帧计数不正确。
消除了代码的 PowerPoint 方面后,我将其范围缩小到以下保存 ffmpeg 管道输出的最小重现示例:
from subprocess import Popen, PIPE
video_path = 'test_mp4.mp4'
ffmpeg_pipe = Popen(['ffmpeg',
'-y', # Overwrite files
'-i', f'{video_path}', # Input from file
'-f', 'avi', # Output format
'-c:v', 'libx264', # Codec
'-'], # Output to pipe
stdout=PIPE)
new_path = "piped_video.avi"
vid_file = open(new_path, "wb")
vid_file.write(ffmpeg_pipe.stdout.read())
vid_file.close()
我测试了几个不同的视频。我测试过的一个小示例视频可以在here找到。
我尝试了几种具有
avi
格式的不同编解码器,并尝试了 libvpx
和 webm
格式。对于 avi
输出,帧计数通常读作 1073741824
(2^30)。奇怪的是,对于 webm
格式,帧计数读作 -276701161105643264
。
编辑:也可以使用以下命令在命令提示符下仅使用 ffmpeg 来重现此问题:
ffmpeg -y -i .\test_mp4.mp4 -f avi -c:v libx264 - > output.avi
这是我用来读取帧计数的片段,但也可以通过在 Windows 资源管理器中打开视频详细信息并查看总时间(例如 9942 小时 3 分 14 秒)来看到错误。
import cv2
video_path = 'test_mp4.mp4'
new_path = "piped_video.webm"
cap = cv2.VideoCapture(video_path)
print(f"Original video frame count: = {int(cap.get(cv2.CAP_PROP_FRAME_COUNT)):d}")
cap.release()
cap = cv2.VideoCapture(new_path)
print(f"Piped video frame count: = {int(cap.get(cv2.CAP_PROP_FRAME_COUNT)):d}")
cap.release()
也可以使用
ffprobe
和以下命令来观察错误:ffprobe -v error -count_frames -show_entries stream=duration,nb_read_frames,r_frame_rate .\output.avi
。请注意,ffprobe 计数的帧速率和帧数与元数据中的持续时间不匹配。
为了完整起见,这里是 ffmpeg 输出:
ffmpeg version 2023-06-11-git-09621fd7d9-full_build-www.gyan.dev Copyright (c) 2000-2023 the FFmpeg developers
built with gcc 12.2.0 (Rev10, Built by MSYS2 project)
configuration: --enable-gpl --enable-version3 --enable-static --disable-w32threads --disable-autodetect --enable-fontconfig --enable-iconv --enable-gnutls --enable-libxml2 --enable-gmp --enable-bzlib --enable-lzma --enable-libsnappy --enable-zlib --enable-librist --enable-libsrt --enable-libssh --enable-libzmq --enable-avisynth --enable-libbluray --enable-libcaca --enable-sdl2 --enable-libaribb24 --enable-libaribcaption --enable-libdav1d --enable-libdavs2 --enable-libuavs3d --enable-libzvbi --enable-librav1e --enable-libsvtav1 --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxavs2 --enable-libxvid --enable-libaom --enable-libjxl --enable-libopenjpeg --enable-libvpx --enable-mediafoundation --enable-libass --enable-frei0r --enable-libfreetype --enable-libfribidi --enable-liblensfun --enable-libvidstab --enable-libvmaf --enable-libzimg --enable-amf --enable-cuda-llvm --enable-cuvid --enable-ffnvcodec --enable-nvdec --enable-nvenc --enable-d3d11va --enable-dxva2 --enable-libvpl --enable-libshaderc --enable-vulkan --enable-libplacebo --enable-opencl --enable-libcdio --enable-libgme --enable-libmodplug --enable-libopenmpt --enable-libopencore-amrwb --enable-libmp3lame --enable-libshine --enable-libtheora --enable-libtwolame --enable-libvo-amrwbenc --enable-libcodec2 --enable-libilbc --enable-libgsm --enable-libopencore-amrnb --enable-libopus --enable-libspeex --enable-libvorbis --enable-ladspa --enable-libbs2b --enable-libflite --enable-libmysofa --enable-librubberband --enable-libsoxr --enable-chromaprint
libavutil 58. 13.100 / 58. 13.100
libavcodec 60. 17.100 / 60. 17.100
libavformat 60. 6.100 / 60. 6.100
libavdevice 60. 2.100 / 60. 2.100
libavfilter 9. 8.101 / 9. 8.101
libswscale 7. 3.100 / 7. 3.100
libswresample 4. 11.100 / 4. 11.100
libpostproc 57. 2.100 / 57. 2.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'test_mp4.mp4':
Metadata:
major_brand : mp42
minor_version : 0
compatible_brands: isommp42
creation_time : 2022-08-10T12:54:09.000000Z
Duration: 00:00:06.67, start: 0.000000, bitrate: 567 kb/s
Stream #0:0[0x1](eng): Video: h264 (High) (avc1 / 0x31637661), yuv420p(progressive), 384x264 [SAR 1:1 DAR 16:11], 563 kb/s, 30 fps, 30 tbr, 30k tbn (default)
Metadata:
creation_time : 2022-08-10T12:54:09.000000Z
handler_name : Mainconcept MP4 Video Media Handler
vendor_id : [0][0][0][0]
encoder : AVC Coding
Stream mapping:
Stream #0:0 -> #0:0 (h264 (native) -> h264 (libx264))
Press [q] to stop, [?] for help
[libx264 @ 0000018c68c8b9c0] using SAR=1/1
[libx264 @ 0000018c68c8b9c0] using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX FMA3 BMI2 AVX2
[libx264 @ 0000018c68c8b9c0] profile High, level 2.1, 4:2:0, 8-bit
Output #0, avi, to 'pipe:':
Metadata:
major_brand : mp42
minor_version : 0
compatible_brands: isommp42
ISFT : Lavf60.6.100
Stream #0:0(eng): Video: h264 (H264 / 0x34363248), yuv420p(progressive), 384x264 [SAR 1:1 DAR 16:11], q=2-31, 30 fps, 30 tbn (default)
Metadata:
creation_time : 2022-08-10T12:54:09.000000Z
handler_name : Mainconcept MP4 Video Media Handler
vendor_id : [0][0][0][0]
encoder : Lavc60.17.100 libx264
Side data:
cpb: bitrate max/min/avg: 0/0/0 buffer size: 0 vbv_delay: N/A
[out#0/avi @ 0000018c687f47c0] video:82kB audio:0kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 3.631060%
frame= 200 fps=0.0 q=-1.0 Lsize= 85kB time=00:00:06.56 bitrate= 106.5kbits/s speed=76.2x
[libx264 @ 0000018c68c8b9c0] frame I:1 Avg QP:16.12 size: 3659
[libx264 @ 0000018c68c8b9c0] frame P:80 Avg QP:21.31 size: 647
[libx264 @ 0000018c68c8b9c0] frame B:119 Avg QP:26.74 size: 243
[libx264 @ 0000018c68c8b9c0] consecutive B-frames: 3.0% 53.0% 0.0% 44.0%
[libx264 @ 0000018c68c8b9c0] mb I I16..4: 17.6% 70.6% 11.8%
[libx264 @ 0000018c68c8b9c0] mb P I16..4: 0.8% 1.7% 0.6% P16..4: 17.6% 4.6% 3.3% 0.0% 0.0% skip:71.4%
[libx264 @ 0000018c68c8b9c0] mb B I16..4: 0.1% 0.3% 0.2% B16..8: 11.7% 1.4% 0.4% direct: 0.6% skip:85.4% L0:32.0% L1:59.7% BI: 8.3%
[libx264 @ 0000018c68c8b9c0] 8x8 transform intra:59.6% inter:62.4%
[libx264 @ 0000018c68c8b9c0] coded y,uvDC,uvAC intra: 48.5% 0.0% 0.0% inter: 3.5% 0.0% 0.0%
[libx264 @ 0000018c68c8b9c0] i16 v,h,dc,p: 19% 39% 25% 17%
[libx264 @ 0000018c68c8b9c0] i8 v,h,dc,ddl,ddr,vr,hd,vl,hu: 21% 25% 30% 3% 3% 4% 4% 4% 5%
[libx264 @ 0000018c68c8b9c0] i4 v,h,dc,ddl,ddr,vr,hd,vl,hu: 22% 20% 16% 6% 8% 8% 8% 5% 6%
[libx264 @ 0000018c68c8b9c0] i8c dc,h,v,p: 100% 0% 0% 0%
[libx264 @ 0000018c68c8b9c0] Weighted P-Frames: Y:0.0% UV:0.0%
[libx264 @ 0000018c68c8b9c0] ref P L0: 76.2% 7.9% 11.2% 4.7%
[libx264 @ 0000018c68c8b9c0] ref B L0: 85.6% 12.9% 1.5%
[libx264 @ 0000018c68c8b9c0] ref B L1: 97.7% 2.3%
[libx264 @ 0000018c68c8b9c0] kb/s:101.19
所以问题是:为什么会发生这种情况,如何避免这种情况?
正如我上面评论的,这 100% 是由于将 AVI 文件输出到管道。查看这部分FFmpeg源代码:
具体来说,如果写入管道,则会跳过从第 924 行开始的
if
块:
if (pb->seekable & AVIO_SEEKABLE_NORMAL) {
...
if (avi->riff_id == 1) {
...
} else {
...
avio_wl32(pb, nb_frames);
...
}
}
这会导致管道输出丢失一些标头属性,包括上面摘录所示的
nb_frames
。此外,还跳过了一些流属性(第 969 行-)
因此,您所遇到的情况确实是故意的,FFmpeg 开发人员不太可能将其视为错误。
我要提供一个Python脚本来手动将
nb_frames
填充到检索到的bytearray
,但其他跳过的字段无论如何都可能会导致问题。因此,我建议您将 AVI 文件(顺便说一句,MP4 文件现在可能是 PowerPoint 的更好选择)写入临时目录并读取输出文件。像这样的东西:
from tempfile import TemporaryDirectory
import subprocess as sp
from os import path
video_path = 'test_mp4.mp4'
with TemporaryDirectory() as temp_dir:
new_path = path.join(temp_dir, "piped_video.avi")
sp.run('ffmpeg',
'-y', # Overwrite files
'-i', f'{video_path}', # Input from file
'-f', 'avi', # Output format
'-c:v', 'libx264', # Codec
new_path]) # Output to pipe
from open(new_path,'rb') as f:
b = f.read()