text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

使用单词嵌入的文本分类

我有一个包含正负内容的数据集。因此,我们假设这是一个垃圾邮件项目。我需要建立一个模型,可以对pos / neg中的内容进行分类。所以我正在做有监督的学习...

回答 3 投票 0

如何使用Tensorflow中的Hugging Face Transformers库对自定义数据进行文本分类?

我正在尝试使用Hugging Face'Transformers'库提供的不同转换器架构对自定义数据(csv格式)进行二进制文本分类。我正在使用此...

回答 1 投票 4

文档分类:预处理和多个标签

我对单词表示算法有疑问:word2Vec,doc2Vec和Tf-IDF中哪一种算法更适合于处理文本分类任务?我的......>

回答 1 投票 1


密集softmax层中的输出数量

我一直在完成Coursera课程的额外练习,遇到了我不明白的问题。链接到Collab就我研究ML神经网络问题而言,我一直都是...

回答 1 投票 1

Keras深度学习情感分析-有监督还是无监督

我有点困惑,因为关于深度学习这个话题。我的问题:假设我们有一个要解决的任务。应当使用Keras对评论进行正面或负面的归类...

回答 1 投票 -1

[使用Python进行文本分类存储

在文本分类中,我拥有近百万种功能,现在我想对常用功能进行分类。请提出一些建议。例如:<1> [alumel','alumin','alumina','aluminia','...

回答 1 投票 0

如何根据内容对与圣经有关的文本进行分类

我有一个来自社交网络(FB,Twitter)评论的文本数据库。我的目标是根据内容对与圣经有密切关系的文本进行分类(例如,如果有引文或“ ...

回答 1 投票 0


如何使OneClassSVM模型更准确? (Scikit学习)

我一直在尝试使用该作者撰写的多篇文章对作者进行分类,然后将其用于查找其他文章中的相似之处,以在测试组中识别该作者。我有...

回答 2 投票 0

用于文本分类的一类SVM模型(scikit-learn)

我正在尝试对一组文本进行分类,以用于预测测试文本集中的相似文本。我正在使用one_class_svm模型。 'author_corpus'包含书面文本列表...

回答 1 投票 0

使用NLTK生成将推文归类为预定义类别的词典

我有一个Twitter用户列表(screen_names),我需要将其归类为7个预定义类别-教育,艺术,体育,商业,政治,汽车,技术,根据其兴趣...

回答 1 投票 0

为什么要通过HuggingFace进行序列分类(DistilBertForSequenceClassification)的第一个隐藏状态

在HuggingFace进行的序列分类的最后几层中,他们采用了用于分类的变压器输出的序列长度的第一个隐藏状态。 hidden_ state = ...

回答 1 投票 0

使用朴素贝叶斯进行多分类

我的数据集如下:data = [[92,155],[56、186、117、210、224],[247、202、189、210、65、3、270、224],[20 ,14,14,157,224],[17,89,158,224],[263,283,68,224],[182,166,224],[...] >>

回答 1 投票 0

列表中单词的二进制分类器

我已经使用OCR从许多样式化文档中提取了文本。现在,我想对数据进行形式化并提取城市名称。由于OCR不能正常工作,因此有时名称拼写错误,并且...

回答 1 投票 0

将相应的类添加到predict_proba(GridSearchCV sklearn)

我正在使用GridSearchCV和管道来对一些文本文档进行分类。代码段:clf = Pipeline([[''vect',TfidfVectorizer()),('clf',SVC())])参数= {'vect__ngram_range':[(1,2)],'...] >

回答 2 投票 4

如何细化中性情绪是正面还是负面

我正在通过视觉和文字提示进行多模式情感分析。我的输入数据集包含地面真相的中立情绪,但我需要进行二进制分类才能对...

回答 1 投票 1

我如何使我的算法与KNN文本分类一起使用?

[尝试使我的分类接受文本(字符串),而不仅仅是数字(数字)。处理数据,承载大量拉出的文章,我希望分类算法显示要... ...>

回答 1 投票 0

带有word2vec堆栈溢出标记预测变量的文本分类

我正在使用堆栈溢出标记预测变量。我有一个数据框df,其中包含功能“ post”和标签“ Tags”,它们可以是多标签的。我的df是:标记发布0 [php]检查上传文件...

回答 1 投票 -1

句子的Pytorch数据加载器

[我已经收集了一个小的数据集用于二进制文本分类,我的目标是使用卷积神经网络提出的用于句子分类的方法训练模型,我开始...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.