我在 HuggingFace 上使用带有 Langchain 的 DirectoryLoader,就像我的名为“data”的文件夹中的那样:
from langchain.document_loaders import DirectoryLoader
loader = DirectoryLoader('./data/')
raw_documents = loader.load()
但出现以下错误:
导入错误:partition_docx 不可用。使用 pip install "unstructed[docx]" 安装 docx 依赖项
有谁知道为什么会出现此错误?我在网络上搜索此错误时没有弹出任何内容。
提前致谢!如果需要更多上下文,我很抱歉,刚刚进入 python,我是新手。
您需要安装非结构化,假设您已经安装了其他依赖项,例如 libreoffice..
pip install unstructured