text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

有没有办法使用python根据某些给定的关键字对文本进行分类?

我正在尝试为我正在从事的项目学习一些机器学习。目前,我设法使用SVM对带有sklearn和spacy的文本进行了分类,但效果很好,但是我想...

回答 1 投票 0

Spacy文本分类分数

我对NLP文本分类非常陌生,并试图了解其基础知识。看来Spacy更适合我的工作和经验。我已阅读所有文档并运行示例代码...

回答 2 投票 0

IBM NL分类器和NLU定制模型分类有什么区别?

IBM NL分类器和NLU定制模型分类之间有什么区别? NL分类器是针对文本(可能是短文本)进行训练的,并且在检查NLU自定义模型时也可以进行训练...

回答 1 投票 0

DecisionTreeClassifier的预测置信度

我试图了解分类算法如何创建一种通用管道,所以我只是从LinearSVC模型开始。一般来说,我在做:模型= LinearSVC(loss ='...

回答 1 投票 0

当重采样方法不适用于文本时,如何为文本分类创建SMOTE管道步骤?

我有一个带有大类不平衡问题的多标签分类问题,因此我想使用SMOTE创建流水线步骤,但由于X基本上是文本,而Y是1和...的数组,所以] >

回答 1 投票 1

文本分类是否足够快以进行类型预先搜索?

我正在设计可用于搜索许多不同内容的预输入服务。我在考虑创建文本分类模型以对这些搜索进行分类,然后再...

回答 1 投票 0


重新调校的生产模式与标+预测的数据?

比方说,我目前在做文本分类有两个不同的班级。标记的数据我现在已经是一个我已经手动分为X或Y的数据集是ATM样的大...

回答 1 投票 0

统一文本和图像分类(蟒蛇)

我工作的一个代码,分类科学文章(使用标题和摘要)的文本。而对于这个我使用的是SVM,它提供了一个良好的精度(83%)。同时,我用了CNN ...

回答 2 投票 1

意为“黄金感悟分配”的?

什么是“黄金人气分布”的意味?我读了几篇论文,他们已经提及的“黄金感悟分布:我试图找到它在谷歌,但我找不到解释或...

回答 1 投票 0

提取最重要的功能(每类)使用mutual_info_classif

我使用mutual_info_classif确定二进制文本分类任务是最重要的话:mi_score = mutual_info_classif(X,Y),但上面给出的特征分数的数组...

回答 1 投票 0

分类多个文档,并将它们在不同的文件夹中存储经由瓶(蟒蛇)

我想要做的就是我希望我的web应用程序把多个文件作为输入,并使用我的模型进行归类和归类文档存储到不同的文件夹。我已经开发出一种模型,...

回答 1 投票 0

分类基于词语的R列表

我有一个文章标题和我想基于匹配的词进行分类文摘数据集。 “这是我想基于这从一个匹配的字词进行分类文本的例子...

回答 1 投票 0

根据输入形状的计算是否存在差异? (使用Tensorflow的Python中的CNN)

我参考了论文解决了文本分类问题(Kim,2014)。然后我发现在两个模型之间,左边的模型(模型1)花费的时间比...的大约多2.5倍。

回答 1 投票 2

预测svm中的多类

我有用户评论数据集,如review-1,0,1,1,0,0 review-1是用户评论,0,1,1,0,0是评论类别。一篇评论可以有多个类别。我想预测评论的类别。所以我 ...

回答 1 投票 1

找到最好的机器学习来预测产品类别

我有一个包含产品的数据框,在这个数据框中我有一些功能,如:品牌,cat1,cat2,cat3,city,desc,image_count,里程,价格,标题,年份。目标是预测类别......

回答 1 投票 -1

keras中文本分类中相同代码的准确度不同

我正在训练一个基于LSTM的循环神经网络进行文本分类,我有一个奇怪的行为。使用相同的代码和相同的训练集,我获得了非常不同的准确度。一世 ...

回答 2 投票 0

用于文本分类的数据增强

关于文本分类的当前最新数据增强技术是什么?我在网上做了一些关于如何通过做一些数据转换扩展我的训练集的研究,......

回答 1 投票 -1

我可以在Keras密集层上使用3D输入吗?

作为练习,我只需要使用密集层来执行文本分类。我想利用单词嵌入,问题在于数据集然后是3D(样本,句子的单词,嵌入...

回答 2 投票 1

SVM和NN模型过度拟合大数据

我已经使用sklearn为两个类训练了SVM和NN模型。一个班级有24000条推文和另外32000条推文。当我进行验证时,它会像这样给出 - text_clf = Pipeline([('vect',...

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.