我目前正在努力部署具有自定义推理代码的 SageMaker 端点以及用于对象检测和跟踪的自定义容器。我的目标是对 Amazon S3 中存储的视频执行实时视频分析。但是,我在解析视频文件并将其发送到端点而不遇到服务器超时时遇到困难。
我尝试通过 API 直接将视频文件发送到端点,但在下载整个视频之前服务器时间已耗尽。在网上研究后,我发现建议将视频预处理成帧,然后通过 API 发送。但是,我的自定义推理代码旨在处理视频文件,而不是单个帧。
考虑到我的自定义推理代码仅支持视频输入,处理存储在 S3 中的视频文件并将其输入 SageMaker 端点以进行对象检测和跟踪的最有效方法是什么?
以下是我的一些具体问题:
提前感谢您的帮助!
如果您愿意,可以使用异步端点。这些端点每个请求有 1 小时的超时期限,并允许 1GB 的有效负载。
请参阅此处的博客,其中展示了如何对大型视频进行推理。 https://aws.amazon.com/blogs/machine-learning/run-computer-vision-inference-on-large-videos-with-amazon-sagemaker-asynchronous-endpoints/