我发现我们现在无法直接从 Pytorch 下载 ImageNet 数据集。我收到此错误:
RuntimeError: The dataset is no longer publicly accessible. You need to download the archives externally and place them in the root directory.
所以我进入网站并下载了
32X32
图像(为什么下载这么慢?)。因此,它批量下载了训练数据,当我加载其中一个数据并查看图像的外观时,我得到了以下结果:
这是我加载图像的方法:
file_1 = np.load("imagenet/Imagenet32_train_npz/train_data_batch_1.npz")
img = file_1['data'][0]
img = np.reshape(img, (32,32,3))
plt.imshow(img)
plt.show()
我做错了什么还是 ImageNet 只是改变了?让我知道。
我也遇到过同样的问题,我知道 imagenet 数据首先是通道,这意味着您不应将其重塑为 (32, 32, 3),而应该将其重塑为 (3, 32, 32),然后将其转置为完整的代码看起来像这样:
file_1 = np.load("yourpath" , allow_pickle=True)
images = file_1["data"].reshape(-1 , 3 , 32 , 32)
images = images.transpose(0 , -2 , -1 , 1)
数据库被暂时关闭了。与人类相关的数据存在一些“问题”。 这个问题通常没有被公开,但希望在更高版本的 imagenet 中得到修复。
参见: