我试图从GStreamer框架实时接收帧与帧之间的numpy数组。
我已经尝试在Python中使用这样的管道(从http://stackoverflow.com/questions/8187257/play-audio-and-video-with-a-pipeline-in-gstreamer-python/8197837进行修改):
self.filesrc = Gst.ElementFactory.make('filesrc')
self.filesrc.set_property('location', self.source_file)
self.pipeline.add(self.filesrc)
# Demuxer
self.decoder = Gst.ElementFactory.make('decodebin')
self.decoder.connect('pad-added', self.__on_decoded_pad)
self.pipeline.add(self.decoder)
# Video elements
self.videoqueue = Gst.ElementFactory.make('queue', 'videoqueue')
self.pipeline.add(self.videoqueue)
self.autovideoconvert = Gst.ElementFactory.make('autovideoconvert')
self.pipeline.add(self.autovideoconvert)
self.autovideosink = Gst.ElementFactory.make('autovideosink')
self.pipeline.add(self.autovideosink)
# Audio elements
self.audioqueue = Gst.ElementFactory.make('queue', 'audioqueue')
self.pipeline.add(self.audioqueue)
self.audioconvert = Gst.ElementFactory.make('audioconvert')
self.pipeline.add(self.audioconvert)
self.autoaudiosink = Gst.ElementFactory.make('autoaudiosink')
self.pipeline.add(self.autoaudiosink)
self.progressreport = Gst.ElementFactory.make('progressreport')
self.progressreport.set_property('update-freq', 1)
self.pipeline.add(self.progressreport)
所有管道也已链接。但是,我不知道如何从流中实时进行numpy数组检索。你有什么建议吗?
原始问题中的管道旨在显示视频和播放音频,因此它分别使用autovideosink
和autoaudiosink
元素。如果要将视频帧转到应用程序而不是屏幕上,则需要使用其他接收器元素,即appsink
而不是autovideosink
。
self.appsink = Gst.ElementFactory.make('appsink')
self.pipeline.add(self.appsink)
[appsink
元素具有一个称为“ new-sample”的信号,可以在新帧可用时连接到该信号。
handler_id = self.app_sink.connect("new-sample", self.__on_new_sample)
然后是将GStreamer的缓冲区格式转换为Numpy数组的问题。
def __on_new_sample(self, app_sink):
sample = app_sink.pull_sample()
caps = sample.get_caps()
# Extract the width and height info from the sample's caps
height = caps.get_structure(0).get_value("height")
width = caps.get_structure(0).get_value("width")
# Get the actual data
buffer = sample.get_buffer()
# Get read access to the buffer data
success, map_info = buffer.map(Gst.MapFlags.READ)
if not success:
raise RuntimeError("Could not map buffer data!")
numpy_frame = np.ndarray(
shape=(height, width, 3),
dtype=np.uint8,
buffer=map_info.data)
# Clean up the buffer mapping
buffer.unmap(map_info)
请注意,此代码对帧数据进行了某些假设,即它是一种3色格式,如RGB,并且该颜色数据将是无符号的8位整数。