如何处理一个 csv 文件数据集,其中一列包含图像名称,另一列包含图像路径?

问题描述 投票:0回答:2

我是Python和机器学习的新手。我只是在练习模型训练和数据集。我发现这个数据集有测试和训练文件夹。在该文件夹中,有几个包含不同的图像(这是一个乐器数据集,因此每个乐器都按不同文件夹中的名称进行分类)。 csv 文件具有仪器的名称及其在文件夹中的路径,如下所示:Instrument.csv

现在我的问题是如何处理这个数据集?我应该遍历训练和测试文件夹还是使用此 csv 文件? 如果我想选择文件夹选项,那么如何浏览每个子文件夹并访问图像? 这是数据集的链接:https://www.kaggle.com/datasets/gpiosenka/musical-instruments-image-classification

如果这个问题没有任何意义或者太容易做,很抱歉。我承认我是菜鸟

python csv machine-learning dataset
2个回答
0
投票

您应该将 csv 文件读入 pandas 数据框以创建数据集。或者,您也可以使用

os.listdir()
https://docs.python.org/3/library/os.html

遍历目录

0
投票

您可以先下载数据,然后提取cnn特征来训练您的模型

您可以使用此代码下载数据: 考虑到图像的链接位于名为“images_link”的列中

将 pandas 导入为 pd train_df = pd.read_csv("数据集/train.csv") download_image(train_df['image_link'], '图像')

© www.soinside.com 2019 - 2024. All rights reserved.