我有一个大约22,000张图像的数据集(整个过程大约900 Mb)我想将它导入Python以训练CNN。
我使用以下代码导入它并将其全部保存在一个名为X的数组中:
import scipy.misc as sm
for i in range (start, end):
imageLink = "./dataSet/" + str(dataSet[i, 0]) + "/" + str(dataSet[i, 1])
image = sm.imread(imageLink)
X = np.append(X, image, axis = 0)
这有几个问题,
图像大小均为640×480。
我做错了什么或这是正常的吗?是否有更好/更快的方法来导入图像?
谢谢。
以下是此类任务的一些常规建议:
imread
读取的JPEG图像转换为Numpy数据结构,并执行所有必需的规范化步骤。将Numpy对象存储到磁盘,以便您的主要培训过程只需要使用numpy.fromfile()
读取它们。