这是编码错误。
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-7-61d7c85f09b2> in <module>()
2
3 model_path = "/content/drive/MyDrive/IDR/rakuten/wikipedia_fastText/cc.ja.300.bin"
----> 4 model = FastText.load_fasttext_format(model_path)
2 frames
/usr/local/lib/python3.7/dist-packages/gensim/models/fasttext.py in _load_dict(self, file_handle, encoding)
818 word_bytes += char_byte
819 char_byte = file_handle.read(1)
--> 820 word = word_bytes.decode(encoding)
821 count, _ = self.struct_unpack(file_handle, '@qb')
822
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe3 in position 0: unexpected end of data
具体错误似乎是
unexpected end of data
。
您确定您已下载的
cc.ja.300.bin
文件是完整的未截断的长度,并且从下载的来源中匹配任何已声明的校验和的内容都没有损坏?分开,
的当前版本中被删除,
load_facebook_model()
现在是首选的表单(尽管这不会考虑您的错误)。