text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

NLP 新手寻求帮助以增强文本分类任务中的模型性能

我尝试建立一个用于中文多标签文本分类任务的模型,但该模型的性能不够好(大约60%的准确率),我来寻求帮助以了解如何增强它。 我

回答 1 投票 0

如何将文档拆分为训练集和测试集?

我正在尝试建立一个分类模型。我的本地文件夹中有 1000 个文本文档。我想将它们分为训练集和测试集,分割比例为 70:30(70 -> 训练和 30 -&...

回答 4 投票 0

如何找到FastText模型在文本分类中的准确性?

在机器学习中,所有模型都有准确率方程,而在FastText模型中,我们没有请支持。

回答 1 投票 0

确定可最小化预测误差的最佳聚合级别

我正在寻找以最大化类别数量同时最小化分类错误的方式聚合预测结果的想法。 作为一个激励性的例子,假设我正在进行预测......

回答 1 投票 0

标记问题的答案。类别“其他”,该怎么办?

我正在训练 SVC 模型来预测调查中答案的类别。在标签中有一个名为“其他”的类别。我尝试设置一个概率,以便只有答案...

回答 1 投票 0

将多个句子传递给BERT?

我有一个包含段落的数据集,我需要将其分为两类。这些段落通常有 3-5 句话长。其中绝大多数的长度都不超过 500 字。我会...

回答 1 投票 0


在网页抓取时检测网页中的评论

我正在尝试抓取带有评论的网站,并且获得了所有网站块 我需要从废弃的网页中提取用户的评论,我该怎么做? 我有两个可能的指示如何做到这一点: S...

回答 1 投票 0

在网页抓取时检测网页中的评论

我正在尝试网络抓取带有评论的网站,并且我得到了所有网站块 我需要从废弃的网页中提取用户的评论,我该怎么做? 我有两个可能的指示如何做到这一点:

回答 1 投票 0

Tensorflow 基本文本分类练习

我正在尝试完成张量流的基本文本分类练习,当我尝试使用堆栈溢出数据集运行 model.fit 时,出现以下错误。我已经关注了...

回答 1 投票 0

Transformers Trainer 的批量和 Epoch 训练指标

有多种方法可以获取 Transformer.Trainer 的指标,但仅用于评估而不是训练。我阅读并发现答案分散在不同的帖子中,例如这篇文章。 但现在...

回答 1 投票 0

无法进行网格搜索和训练模型

我正在研究基本的文本分类问题,我想使用堆叠分类器以及对基本分类器的参数进行一些微调以获得高精度结果。 我的数据集...

回答 1 投票 0

属性错误:模块“os”没有属性“killpg”

这是我的代码: 如果 __name__ == "__main__": 尝试: 主要的() 除了例外: exc_info = sys.exc_info() Traceback.print_exception(*exc_info) os.killpg(0,

回答 2 投票 0

低 f1 分数和低损失函数分数

我正在尝试构建一个多标签文本分类模型来对有毒评论进行分类。 我从此链接中关注了一篇中等文章:Multi-label Text Classification with BERT using Pytorch 我也你...

回答 2 投票 0

使用 OpenAI LLM 进行分类。要求分类与要求概率

我正在使用法学硕士将产品分类为特定类别。多类别。 一种方法是询问特定类别是否是/否,然后循环遍历这些类别。 另一种方式

回答 1 投票 0

属性错误:“文档”对象没有属性“append_page”

我已经使用 pip 安装了 borb 库并在下面的块中出现错误 从 borb.pdf 导入文档 从 borb.pdf.page.page 导入页面 # 创建文档 pdf = 文档() # 添加页面 页=页...

回答 1 投票 0

Stanford CoreNLP 文本分类情感分析

我正在完成我的个人学士学位期末项目,预计将在大约 50 天后完成。我想要创建的网站是一个用户可以分享他们找到 amu 的文章链接的网站......

回答 1 投票 0

使用预训练 Bert 进行二元分类的形状值:如何提取摘要图?

我使用预训练的bert模型进行二元分类。用小数据训练我的模型后,我想提取这样的摘要图,即我想要的图。不过,我想更换这些小鬼...

回答 1 投票 0

文本分类中处理不均匀数据的最佳方法

我正在尝试使用 sklearn 和 Python 对一些文本数据(推文)运行文本分类模型。我已经手工编码了近 1,500 个案例,但是数据不平衡。 案例按主题进行编码。一个...

回答 1 投票 0

处理来自不同文档的相同单词

我正在制作一个Python类,它计算文档中每个单词的tfidf权重。现在我的数据集中有 50 个文档。在这些文档中,许多单词相交,因此有多个相同的单词

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.