ImageNet 数据集图像无法正确加载

问题描述 投票:0回答:2

我发现我们现在无法直接从 Pytorch 下载 ImageNet 数据集。我收到此错误:

RuntimeError: The dataset is no longer publicly accessible. You need to download the archives externally and place them in the root directory.

所以我进入网站并下载了

32X32
图像(为什么下载这么慢?)。因此,它批量下载了训练数据,当我加载其中一个数据并查看图像的外观时,我得到了以下结果: enter image description here

这是我加载图像的方法:

file_1 = np.load("imagenet/Imagenet32_train_npz/train_data_batch_1.npz")
img = file_1['data'][0]
img = np.reshape(img, (32,32,3))
plt.imshow(img)
plt.show()

我做错了什么还是 ImageNet 只是改变了?让我知道。

python-3.x deep-learning dataset vision imagenet
2个回答
1
投票

我也遇到过同样的问题,我知道 imagenet 数据首先是通道,这意味着您不应将其重塑为 (32, 32, 3),而应该将其重塑为 (3, 32, 32),然后将其转置为完整的代码看起来像这样:

file_1 = np.load("yourpath" , allow_pickle=True)
images = file_1["data"].reshape(-1  , 3 , 32 , 32)
images = images.transpose(0 , -2 , -1 , 1)

0
投票

数据库被暂时关闭了。与人类相关的数据存在一些“问题”。 这个问题通常没有被公开,但希望在更高版本的 imagenet 中得到修复。

参见:

https://www.artsy.net/article/artsy-editorial-online-image-database-will-remove-600-000-pictures-art-project-revealed-systems-racist-bias

https://paglen.studio/2020/04/29/imagenet-roulette/

© www.soinside.com 2019 - 2024. All rights reserved.