18帧 /usr/local/lib/python3.10/dist-packages/transformers/models/speecht5/modeling_speecht5.py 向前(自身,input_values,speaker_embeddings) 第700章 第701章 --> 702 输入嵌入 = torch.cat([输入嵌入, 扬声器嵌入], 暗淡=-1) 第703章 704
运行时错误:张量的大小必须匹配(维度 2 除外)。预期大小为 16,但列表中 1 号张量的大小为 256。
尝试了自定义数据集以及https://colab.research.google.com/drive/1i7I5pzBcU3WDFarDnzweIj4-sVVoIUFJ#scrollTo=87U167Vf7V5Q以及来自https://huggingface.co/datasets/facebook/voxpopuli的荷兰语数据集/viewer/cs/train?row=1。在 colab 和 jupiterlap 中都出现相同的错误
做同样的事情并等待答案