我不知道这是否正确的stackexchange论坛在哪里提出这个问题,请告诉我,如果不是这样的话。
我正在开发一个应用程序,它给出一个包含绘画作为输入的输入图像,它能够告诉你绘画的标题。类似的情况是:给定包含建筑物的输入图像,返回的结果是建筑物的名称。
这是什么类型的应用程序?在第一次影响时,我会说“图像分类”之类的东西。我不是计算机视觉方面的专家,但我一直认为“图像分类”就像“给出图像,告诉我图像中包含的内容”。
另一方面,对象检测定义似乎与识别类(例如建筑物)的对象而不是类本身的实例(例如长城)更相关:
对象检测是与计算机视觉和图像处理有关的计算机技术,其涉及在数字图像和视频中检测特定类(例如人,建筑物或汽车)的语义对象的实例。
关于对象识别:
对象识别是能够感知对象的物理属性(例如形状,颜色和纹理)并将语义属性应用于它(例如将对象识别为苹果)。
我真的不知道如何分类(这是一个笑话......)我描述的应用程序。你怎么看?
简单解释一下:你要去森林,它是完全黑暗的。突然之间你会看到与背景不同的东西(纯黑)。这称为检测。
1)出现与你的背景不同的东西。所以你发现了。
2)现在越来越近,你发现它是一种动物。啊..现在你已经分类/认可了。它也可能是人类。
3)现在它越来越近,现在你看到它是一只鹿。所以,现在你确定了它。
所以序列是“检测到 - >识别/分类 - >识别”。
“识别是最后一个外壳,你可以记住你的身份证有你的面孔(已识别),并归类为(人类)。
对象检测: - 检测图像中的对象。它不会提供有关对象是什么的信息。换句话说,对象检测的输出是包含对象的边界框的x,y,宽度和高度。
对象分类: - 告诉对象是什么,例如猫,狗车等。换句话说,在分类或识别输出中将是一个类标签。
我正在开发一个应用程序,它给出一个包含绘画作为输入的输入图像,它能够告诉你绘画的标题。类似的情况是:给定包含建筑物的输入图像,返回的结果是建筑物的名称。
对于你的问题,更合适的一个将是'草图分类'