训练集的颜色配置文件是否在CNN模式识别中发挥作用?

问题描述 投票:0回答:1

我最近开始使用深度学习和CNN引用,试图从它自己的样本中提取最优的特征。我制作了一个模型来识别训练集具有黑色背景图像和白色脚本的字符。 Image Sample

这种类型的模型虽然无法识别白色背景上带有黑色图案的图像(我尝试使用自己的输入和前一组的负片).Negative of Image Sample

是否可以使用相同的模型识别这两种类型的图像,还是需要训练两个单独的模型?我不知道是否可以使用ImageDataGenerator类。以下是当前的代码段:

train_datagen = ImageDataGenerator(rescale = 1./255, shear_range = 0.2, zoom_range = 0.2, horizontal_flip = True)
test_datagen = ImageDataGenerator(rescale = 1./255)
machine-learning keras deep-learning computer-vision conv-neural-network
1个回答
1
投票

嗯,这是一种情况(“负面图像”),正如最近所揭示的那样,结果并不像我们所期望的那样......

有一篇未发表的论文@ArXiv,它准确地说明了在MNIST和CIFAR-10等数据集上达到几乎完美测试精度的CNN模型,在相应的“负面”图像中无法提供类似的性能(即背景和前景倒置,像你的情况一样):

On the Limitation of Convolutional Neural Networks in Recognizing Negative Images

以下是本文的主要结果:

enter image description here

这个问题相当重要,社会上对于这个结果是否真的有预期和不足为奇,在社会上存在强烈的分歧;请参阅(现已存档)相关讨论@ Reddit,以及相关文章@ KDNuggets

总而言之,正如论文所暗示的那样,你可以用一种模式来做,但你需要在训练中包含至少一些这样的“负面”图像。另见SO线程High training accuracy but low prediction performance for Tensorflow's official MNIST model

© www.soinside.com 2019 - 2024. All rights reserved.