nlp 相关问题

自然语言处理（NLP）是人工智能的子领域，涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

使用量化和 AMP 微调预训练模型：缩放器错误“尝试取消缩放 FP16 梯度”

我正在尝试使用有限的 VRAM 来微调预训练模型。为了实现这一目标，我使用量化和自动混合精度 (AMP)。然而，我遇到了一个我似乎无法解决的问题

python pytorch nlp huggingface-transformers fine-tuning

回答 1 投票 0

使用正则表达式分割具有唯一标题的小节

我正在努力寻找一种方法来按部分拆分我拥有的法律文件集。我一直在尝试使用正则表达式来做到这一点，虽然我已经相当接近了，但我想看看是否有一个 w...

python regex parsing split nlp

回答 1 投票 0

如何在keras中使用predict_generator预测无标签文本数据？

我正在尝试使用predict_generator对我的NPL模型进行预测，我的测试数据没有Y变量。我的目的是预测未来文本的标签。我已经尝试过“Y_test=None”...

tensorflow keras nlp generator

回答 1 投票 0

如何从各种语言的 YouTube 视频中提取字幕

我使用下面的代码从 YouTube 视频中提取字幕，但它仅适用于英文视频。我有一些西班牙语视频，所以我想知道如何修改代码以扩展...

python web-scraping nlp youtube video-streaming

回答 2 投票 0

如何从PDF中提取文本，包括图像和文本

我将从多个 PDF 文件中提取文本。 PDF文件包括文本和一些图像，甚至有些页面是扫描页面（我假设扫描页面就像图像）。我遵循了...

python nlp text-mining text-extraction

回答 1 投票 0

继续在新数据上训练 pytorch 模型

我正在研究文本分类任务，并决定使用 PyTorch 模型来实现此目的。该过程主要包括以下步骤：加载并处理文本。使用 TF-IDF 矢量...

python scikit-learn pytorch nlp python-polars

回答 1 投票 0

情感分析中的大写单词

我目前正在处理顾客对丝芙兰产品的评论数据。我的任务是将它们分类为情绪：消极、中性、积极。文本预处理的常见技术是...

nlp sentiment-analysis bert-language-model data-preprocessing

回答 1 投票 0

BertForMaskedLM中的“语言建模头”是什么

我最近阅读了有关 BERT 的内容，并想使用 BertForMaskedLM 来完成 fill_mask 任务。我了解 BERT 架构。另外，据我所知，BertForMaskedLM 是由 BERT 构建的，具有语言建模

nlp bert-language-model huggingface-transformers language-model

回答 2 投票 0

SBERT 嵌入的聚类

我有一组句子，我已使用 SBERT 嵌入将其转换为向量。我想对这些向量进行聚类。当我在网上寻找信息时，我不断看到帖子告诉我要做什么......

nlp cluster-analysis bert-language-model

回答 1 投票 0

使用优先级队列高效实现BPE

我认为它不是严格的BPE（字节对编码），但有类似的想法应用于字符串。假设字典里有三个中文单词（我会使用像

string algorithm nlp compression

回答 2 投票 0

层需要 2 个输入，但它收到了 1 个输入张量

我正在尝试构建模型来预测帖子喜欢，该模型采用文本和内容类型，这是一个热门编码列。我制作了一个 TensorFlow 数据集，但是当尝试拟合模型时，我得到了这个

python tensorflow machine-learning deep-learning nlp

回答 1 投票 0

层需要 2 个输入，但它收到了 1 个输入张量

我正在尝试构建模型来预测帖子喜欢，该模型采用文本和内容类型，这是一个热门编码列。我制作了一个 TensorFlow 数据集，但是当尝试拟合模型时，我得到了这个

python tensorflow machine-learning deep-learning nlp

回答 1 投票 0

unstructured.document.html 中出现 ModuleNotFound 错误

我正在执行这段代码从 unstructed.documents.html 导入 HTMLDocument # 加载你的 HTML 文件 html_file_path = 'UBER_2019.html' doc = HTMLDocument.from_file(html_file_path) # 提取文本 ...

python machine-learning deep-learning nlp large-language-model

回答 1 投票 0

我的 LSTM 模型返回空，没有输出，也没有捕获参数

我正在使用酒店评论数据集构建用于情感分析的 LSTM 模型。但是，每次运行代码时，模型总是返回空的输出和参数。我已经关注我了...

python nlp vectorization lstm sequencing

回答 1 投票 0

如何在 GPU 而不是 RAM 上处理此 Python 代码的数据？

我目前正在使用以下代码来处理音频数据，但它在 RAM 上运行。我想将处理任务转移到 GPU 以提高性能。我的代码： def 准备数据集（批量）：一个...

nlp gpu torch openai-whisper

回答 1 投票 0

无法从“huggingface_hub”导入名称“split_torch_state_dict_into_shards”

我已经使用 LLAMA 2 进行研究几个月了，我导入如下：从 Transformer 导入 AutoModelForCausalLM、AutoTokenizer 设备 = torch.device("cuda") 分词器 =

python nlp huggingface-transformers transformer-model llama

回答 1 投票 0

如何解决从 Hugging Face 导入 LLAMA 2 时出现的错误？

我已经使用 LLAMA 2 进行研究几个月了，我导入如下：从 Transformer 导入 AutoModelForCausalLM、AutoTokenizer 设备 = torch.device("cuda") 分词器 =

python nlp huggingface-transformers transformer-model llama

回答 1 投票 0

为什么我无法使用库“wn_editor”（Python）将新单词添加到WordNet中？

（Python）我现在坚持使用“wn_editor”编辑WordNet词典。它在每个词典中都会保留这样的错误（“odenet”除外）。 ……的文件很少

python nlp typeerror wordnet

回答 1 投票 0

在langchain中使用tavilly实现搜索引擎链

我想在langchain中使用tavilly实现一个搜索引擎链。该链将用户的查询作为输入并返回最多 5 个相关文档。每个检索到的文档必须包含...

python nlp search-engine langchain chain

回答 1 投票 0

为什么在 BERT 中排列位置编码不会影响预期的输出？

我目前正在制作有关变形金刚的 Jupyter 笔记本。在位置编码部分，我想证明 Transformer 完全依赖位置编码来理解...

python pytorch nlp huggingface-transformers

回答 1 投票 0

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.