使用随机森林分类器进行图像分类

问题描述 投票:0回答:1

我想使用随机森林分类器或任何基于机器学习的模型对我的数据集进行训练。所以我的数据集有一个灰色的背景图像,并且图像中心和图像的中心存在任何颜色的形状(任何形状)这个形状我有一个彩色文本。我在不同的文件夹中有图像,例如red_black_shapecolor_textcolor),yellow_orange等..其中有带有黑色文本的红色形状的图像或带有橙色文本的黄色形状的图像在各自的文件夹中。现在我想要这些训练模型,以便当图像来自相机并运行预测时,它应该给我 shapecolor_textcolor 。我不希望预定义 RGB 值,而是模型本身应该从图像中学习并分配 RGB 值根据标签获取各个图像,然后训练这些 RGB 值。我是机器学习新手,我需要一些帮助。我没有找到基于此的足够文档。这种方法正确吗?如果是,我该如何继续,如果不是,我还能实现什么来获取图像的形状颜色和文本颜色

我想从从事过这个工作的人那里得到建议。这样我就可以继续进行它而不浪费时间。我为此尝试过 KNN,我相应地标记了我的图像,然后训练模型并生成训练数据。和 test.data 但是当我给出输入图像进行预测时,它没有给我结果。我认为我的方法有问题。

python computer-vision artificial-intelligence ml
1个回答
0
投票

考虑到问题很广泛并且您需要更好地定义它,我会尽力给您一些建议。

您要解决的问题是分类问题,特别是图像分类。 解决这个问题时经常引入两个不同的步骤:(i) 特征提取和 (ii) 分类。

特征提取

特征提取的目的是将原始图像数据转换为更紧凑、信息更丰富的表示形式,使模型(分类器)能够有效学习并做出准确预测。这种转变有几个关键目的:

  • 降维:图像包含大量的像素数据,直接处理它们需要大量的计算资源。特征提取有助于降低数据的维度,使其更易于管理,同时保留重要信息。
  • 捕获相关信息:并非图像中的所有像素对于分类都同样重要。特征提取算法旨在捕获基本的视觉模式、边缘、纹理和形状,以区分不同的对象或类别。

图像分类中的特征提取阶段可以通过两种主要方式完成:

  • 预定义/静态特征:在这种方法中,从图像中提取预定义的统计特征。这些特征可以包括平均值、最大值、标准差、峰度、中值等统计数据。此外,还可以计算特定领域的特征,例如颜色直方图、纹理描述符或形状特征。
  • 通过 CNN 进行深度学习的动态特征:在这种方法中,卷积神经网络 (CNN) 用于自动学习并从原始图像数据中提取相关特征。 CNN 能够通过应用一系列卷积层和池化层来发现分层和抽象特征。这些学习到的特征是动态的、数据驱动的,这意味着网络根据其训练的特定图像数据来调整其特征提取过程。这种方法被称为端到端学习,因为网络从数据中联合学习特征提取和分类。

图像分类

这部分也可以通过不同的方式完成:如果你提取了默认/静态特征,它可以使用随机 forrest、svm 等分类器。如果你使用 CNN,则分类已经完成,因为正如我之前所说这是一种端到端的方法。我一般认为 CNN 是计算机视觉领域最先进的技术,所以我将它们置于随机福雷斯特之上,随机福雷斯特不是一个适合处理图像的模型,而是适合处理表格数据的模型

© www.soinside.com 2019 - 2024. All rights reserved.