简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。
我有一个大型数据集,其中包含近5亿条推文。我正在做一些有关公司如何参与激进主义的研究,到目前为止,我已经标记了可以聚集在激进主义中的推文...
我有两个文件file1.csv和file2.csv。 file1.csv每行包含一个愚蠢的句子。 file2.csv标识它是哪一列(type0对应于0,type1对应于1)。我想做一个...
我有一个包含文本段和相应标签的标记数据集。每个标签由三部分组成,并且可以将多个或零个标签分配给给定的文本段。示例...
我正在尝试使用pytorch-nlp(https://pytorchnlp.readthedocs.io/en/latest/)构建神经网络。我的意图是建立像这样的网络:嵌入层(使用pytorch标准层和...
我需要对n = 630个职位描述的job_experience部分中的各个句子进行分类/分类。我对提取工作经验和与能力相关的句子特别感兴趣,...
我怎么知道LibShortText预测输出文件中每个分数对应于哪个类?
我使用LibShortText进行短文本分类。我训练了一个模型,并通过运行以下模型来对测试集进行类预测:python text-train.py -L 0 -f ./demo/train_file python text-predict ....
该程序应该返回列表中最相似的第二个文本,因为它是相同的单词。但是这里不是这样。从nltk.tokenize导入gensim。从gensim导入word_tokenize。...
我有两个文件file1.csv和file2.csv。 file1.csv每行包含一个愚蠢的句子。 file2.csv标识它是哪一列(type0对应于0,type1对应于1)。我想做一个...
我正在尝试为文本分类训练一个模型,该模型采用从文章中嵌入的最多300个整数的列表。该模型可以毫无问题地进行训练,但精度几乎不会提高。 ...
我正在尝试使用elmo模型对自己的数据集进行文本分类。训练完成,课程数量为4(使用keras模型和elmo嵌入)。在预测中,我得到了...
我正在研究多类文本分类,如何将一种热编码方法传入keras模型以在ytrainset中进行训练?
我正在研究文本分类问题。我的ytrain中有9个标签,但是当我将xtrain和ytrain传递给model时,它给了我错误:期望具有shape(1,)但得到了(9,)。和我的大小...
是否可以用标记的数据训练情感分类模型,然后将其用于预测未标记的数据的情感?
我想使用机器学习(文本分类)方法进行情感分析。例如nltk朴素贝叶斯分类器。但是问题是我的少量数据被标记了。 (例如,...
我是tensorflow和机器学习的新手。我在编写一个tensorflow代码时遇到了问题,该代码的文本分类类似于我使用sklearn库尝试的文本分类。我正面临主要...
我正在通过此链接来了解用于文本分类的多通道CNN模型。链接:https://machinelearningmastery.com/develop-n-gram-multichannel-convolutional-neural-network-sentiment -...
我想根据它们的相似性对我的SQL查询进行分类。我应该使用哪种分类算法?
scikit-learn向SGDClassifier添加额外数据
我正在尝试使用scikit-learn进行文本分类。我的文字分类不好。我认为我可以通过添加可以以整数数组形式推断出的数据来改善预测。...
我研究了许多文本挖掘方法,并在创建单词袋时陷入困境。我知道这是将单词转换为数字的意思,以便机器可以理解,但是问题是...
Sklearn(NLP文本分类器新手)-形状和矢量化器出现问题,X和Y不匹配
我想创建一个文本分类器,以查看研究摘要,并根据我拥有的标签数据集确定摘要是否专注于获得医疗服务。数据源是Excel ...
[我们知道bert的令牌最大长度限制为512,因此,如果一个Acticle的长度远大于512,例如文本中的10000个令牌,如何使用bert?
有没有办法使用python根据某些给定的关键字对文本进行分类?
我正在尝试为我正在从事的项目学习一些机器学习。目前,我设法使用SVM对带有sklearn和spacy的文本进行了分类,但效果很好,但是我想...