使用Tensorflow Object Detection API作为平面图像识别器的最快方法是什么？

Question

我是计算机视觉的新手，但我正在尝试编写一个android / ios应用程序，它执行以下操作：

获取实时相机预览并尝试检测其中的一个平面图像（徽标或绘画）。实时。如果找到，请在徽标周围绘制一个矩形。如果没有匹配，请不要绘制矩形。

我发现Tensorflow Object Detection API是一个很好的起点。刚刚宣布支持将TensorFlow模型导入Core ML。

我按照很多教程来训练我自己的物体探测器。培训数据是关键。我为generate augmented image找到了一个非常好的图书馆。我创建了数百种不同的图像源（旋转，倾斜等......）。但它失败了！此数据集可能适用于图像分类（我的图像为全屏），但不适用于上下文（房间）。

我认为转移学习是关键，在我的例子中，我使用ssd_mobilenet_v1_coco模型作为基础。我试图用Random Erasing Data Augmentation technique伪造我的增强图像的上下文但没有成功。

我有哪些解决方案？我是否正确解决了这个问题？我需要尽快进行模型训练。

我是否必须使用一些数据集进行室内 - 室外图像分类，并将我的图像随机放在上面？这些观点有多重要？

谢谢！

Answer 1

I have created hundreds of variation of my image source (rotation, skew etc ...). But it has failed!

那么这意味着你的模型没有收敛或最终表现不好？如果您的模型没有收敛，则添加更多数据。 “数百个样本”很少。因此，请使用更多图像并制作更多样本，并尽可能使样本分散。

I think transfer-learning is the key, In my case, I used the ssd_mobilenet_v1_coco model as a base. I tried to fake the context of my augmented image with the Random Erasing Data Augmentation technique without success.

你的意思是微调。您是否将标签缩小为2（您的图像和背景）并进行了微调。如果你没有，那你肯定失败了。哦，伙计，你至少应该告诉我你的模型定义。

What are my available solutions? Do I tackle the problem rightly? I need to make the model training as fast as possible.

为了使培训更快地融合，只需添加更多GPU并在多个GPU上进行训练。如果您没有钱，请在Azure上租用一些GPU集群。相信我，它并不贵。

希望有所帮助

使用Tensorflow Object Detection API作为平面图像识别器的最快方法是什么？

问题描述投票：-2回答：1

1个回答

最新问题

使用Tensorflow Object Detection API作为平面图像识别器的最快方法是什么？

问题描述 投票：-2回答：1

1个回答

最新问题

问题描述投票：-2回答：1