使用Tensorflow Object Detection API作为平面图像识别器的最快方法是什么?

问题描述 投票:-2回答:1

我是计算机视觉的新手,但我正在尝试编写一个android / ios应用程序,它执行以下操作:

获取实时相机预览并尝试检测其中的一个平面图像(徽标或绘画)。实时。如果找到,请在徽标周围绘制一个矩形。如果没有匹配,请不要绘制矩形。

我发现Tensorflow Object Detection API是一个很好的起点。刚刚宣布支持将TensorFlow模型导入Core ML。

我按照很多教程来训练我自己的物体探测器。培训数据是关键。我为generate augmented image找到了一个非常好的图书馆。我创建了数百种不同的图像源(旋转,倾斜等......)。但它失败了!此数据集可能适用于图像分类(我的图像为全屏),但不适用于上下文(房间)。

我认为转移学习是关键,在我的例子中,我使用ssd_mobilenet_v1_coco模型作为基础。我试图用Random Erasing Data Augmentation technique伪造我的增强图像的上下文但没有成功。

我有哪些解决方案?我是否正确解决了这个问题?我需要尽快进行模型训练。

我是否必须使用一些数据集进行室内 - 室外图像分类,并将我的图像随机放在上面?这些观点有多重要?

谢谢!

machine-learning tensorflow computer-vision template-matching
1个回答
0
投票
I have created hundreds of variation of my image source (rotation, skew etc ...). But it has failed! 

那么这意味着你的模型没有收敛或最终表现不好?如果您的模型没有收敛,则添加更多数据。 “数百个样本”很少。因此,请使用更多图像并制作更多样本,并尽可能使样本分散。

I think transfer-learning is the key, In my case, I used the ssd_mobilenet_v1_coco model as a base. I tried to fake the context of my augmented image with the Random Erasing Data Augmentation technique without success.

你的意思是微调。您是否将标签缩小为2(您的图像和背景)并进行了微调。如果你没有,那你肯定失败了。哦,伙计,你至少应该告诉我你的模型定义。

What are my available solutions? Do I tackle the problem rightly? I need to make the model training as fast as possible.

为了使培训更快地融合,只需添加更多GPU并在多个GPU上进行训练。如果您没有钱,请在Azure上租用一些GPU集群。相信我,它并不贵。

希望有所帮助

© www.soinside.com 2019 - 2024. All rights reserved.