使用我的
__getitem__
函数检查时,它正确地提供了图像、标题和 class_id。图像是大小为 [3, 256, 256] 的张量,标题是 20 个元素的 list。
但是当我观察数据加载器时,它以错误的方式对字幕进行分组。批量大小为 32。因此,对于一批数据,dataloader 的预期组件是 32 个图像、32 个标题和 32 个 class_ids。
但是数据加载器给出了 32 张图像、20 个标题 和 32 个 class_id。 其中 20 是标题的最大长度.
数据加载器不是给出每个长度为 20 的 32 个标题,而是给出一个包含 20 个元组的列表,每个元组的长度为 32.
如何处理?