我正在尝试按照本教程进行操作https://www.youtube.com/watch?v=E2shqsYwxck(使用开源本地法学硕士从头开始构建 Corrective RAG),源代码如下:https: //github.com/langchain-ai/langgraph/blob/main/examples/rag/langgraph_crag_local.ipynb。我在索引部分收到以下错误(代码后跟图像中的错误输出)。
# Load
url = "https://lilianweng.github.io/posts/2023-06-23-agent/"
loader = WebBaseLoader(url)
docs = loader.load()
# Split
text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
chunk_size=500, chunk_overlap=100
)
all_splits = text_splitter.split_documents(docs)
# Embed and index
if run_local == "Yes":
embedding = GPT4AllEmbeddings()
else:
embedding = MistralAIEmbeddings(mistral_api_key=mistral_api_key)
# Index
vectorstore = Chroma.from_documents(
documents=all_splits,
collection_name="rag-chroma",
embedding=embedding,
)
retriever = vectorstore.as_retriever()
我相信这是 Windows 和 Chroma 软件包兼容性问题。我尝试使用 python Locale 包来检查我的计算机正在使用的文化。看起来 python 环境很好,但 Chroma 无法识别它......有什么建议吗?
我无法在 Windows 上纠正此问题。但是,我可以按照以下说明使用 Windows 子系统 Linux 来使用 chromadb:https://learn.microsoft.com/en-us/windows/python/web-frameworks
基本上我可以使用 Visual Studio Code GUI 并拥有 Linux 后端!非常好,我以后都会用这个。