跨多个具有不同视角的图像进行对象搜索

问题描述 投票:0回答:0

BirdsEyeView

ParallelView

大家好,

context:我正在处理两个图像。图 1 是鸟瞰图,图 2 是平行视图(略微倾斜)。 Image-1、Image-2 具有与上图所示相同的感兴趣对象

对象是Air Pods, Black Mouse, AC Remote

问题陈述:有没有一种方法可以使用计算机视觉使用 Image-1 网格位置来预测/校准 Image-2 中存在的对象的网格位置。这样我就可以推断出坐标(18,5)(鸟瞰图)中的对象映射到(平行视图)中的坐标(4,3)

以上坐标只是举例,确实符合图中的网格

示例 1:在图 1 中,Airpods 的网格位置在坐标 (5,3) (5,4) (6,3) (6,4) 中,在图 2 中,网格位置由于某种倾向,被翻译成 (5,3) (5,4)

Example-2:在 Image-1 中,Black Mouse 的网格位置在坐标 (8,4) (8,5) (6,3) (6,4) 中,在 Image-2 中,网格位置由于某些倾向,位置被转换为 (6,2) (6,3) (7,2) (7,3)

跨图像预测/映射网格位置的能力将有助于正确检测对象,即使存在相同对象类型的多个实例(如多个 airpods)

感谢您来看问题。乐于回答解决问题所需的任何问题。干杯

我尝试过对象检测来识别感兴趣的对象,例如 Airpods,并尝试使用跨图像的 SIFT 算法计算图像相似度。它可以在第二张图片(平行视图)中识别 airpods,但是当有多个相同的 airpods 时就会出现问题

python machine-learning deep-learning computer-vision artificial-intelligence
© www.soinside.com 2019 - 2024. All rights reserved.