text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

删除停用词并仅选择熊猫中的名字

我正在尝试按日期提取热门单词,如下所示:df.set_index('Publishing_Date')。Quotes.str.lower()。str.extractall(r'(\ w +)')[0] .groupby( 'Publishing_Date')。value_counts()。groupby('Publishing_Date')...

回答 1 投票 1

如何使用Tf-idf功能训练模型?

从sklearn.feature_extraction.text导入TfidfVectorizer tfidf = TfidfVectorizer(sublinear_tf = True,min_df = 5,范数='l2',...

回答 1 投票 1

如何计算具有十个特征的数据集的信息增益和熵?

我有一个10K的数据集,并且创建了以下十个特征:距离-(0或1)IsPronoun-(真或假)字符串匹配-(真或假)说明性NP-(如果i和j为说明性则为真...

回答 1 投票 -1

sklearn如何使用保存的模型来预测新数据

我使用sklearn训练了一个SVM文本分类器,并使用tf-idf(TfidfVectorizer)提取了特征。现在,我需要保存模型并加载它,以预测看不见的文本。我将模型加载到另一个...

回答 1 投票 0

Mutli-Class文本分类(使用TFIDF和SVM)。如何实现一个反馈可能属于多个类别的场景?

我有一个原始反馈文件,需要对其进行标记(分类),然后作为SVM分类器(或与此相关的任何分类器)的训练输入。但是要注意的是,我没有分配...

回答 1 投票 1

如何在spaCy中改进德语文本分类模型

我正在研究一个文本分类项目,并为此使用了spacy。现在,我的准确度几乎等于70%,但这还不够。我一直在尝试改进过去两个模型...

回答 1 投票 0

未定义名称'doc2vec'

我正在尝试使用doc2vec进行文本分类,但是在导入后,当我试图在一个函数中使用它时,它说doc2vec未定义。请帮助我确定所有库...

回答 2 投票 0

从多类分类算法输出前2类

我正在研究文本的多类分类问题,其中我有很多不同的类(超过15个)。我已经训练了Linearsvc svm方法(方法只是示例)。但是它只输出...

回答 1 投票 0

使用 CreateML 创建文本分类器模型时收到,“抛出错误但未被捕获:提供的验证数据必须包含...”

我正在使用 Playground 使用 CreateML 创建文本分类器模型并不断收到错误消息: 游乐场执行终止:抛出错误但未被捕获: ▿ 验证数据公关...

回答 3 投票 0

sklearn:调用naive_bayes.MultinomialNB(

我已经看过类似的问题。但是,在我的情况下,上述解决方案均无效。我正在尝试建立文本分类预测模型。 def train_model(classifier,...

回答 1 投票 0

FastText调用是'nan',但精度是一个数字

我使用Python界面在FastText中训练了一个受监督的模型,但由于精度和召回率,我得到了奇怪的结果。首先,我训练了一个模型:model = fasttext.train_supervised(“ train.txt”,...

回答 1 投票 1

用于通过推文预测性别的文本分类器

我正在尝试建立文本分类器,以根据Twitter用户的推文来预测其性别。这是我第一次构建文本分类模型,我不确定要执行的步骤。两个...

回答 1 投票 0

用于分类covid-19论文的神经网络

首先,很抱歉我的英语写作能力很差。我的作业是从头开始实现一个人工神经网络,以根据标题对covid-19数据挖掘论文进行分类,...

回答 1 投票 0

Sklearn的多标签文本分类

为了解决Python中的多标签文本分类,我已经尝试了所有可以想到的方法,非常感谢您的帮助。我在这里使用...

回答 1 投票 0

使用Python进行多标签文本分类

为了解决Python中的多标签文本分类,我已经尝试了所有可以想到的方法,非常感谢您的帮助。我在这里使用...

回答 1 投票 0

数据集语言标识

我正在使用多语言数据集解决文本分类问题。我想知道语言在我的数据集中的分布方式以及这些语言是什么。语言的数量...

回答 2 投票 0

使用fastText句子向量作为输入特征

我想使用fastText句子矢量作为输入功能。 vector = model.get_sentence_vector('Original Sentence')我正在尝试使用MLP和...

回答 1 投票 0

如何修复要素联合和管道中的元组对象错误(使用sklearn时?)>

我有一个56列的熊猫数据框。大约一半的列是float,其余的是字符串(文本数据),最后col56是label列。数据集看起来像这样...

回答 1 投票 0

训练测试中表现出色,测试集上不佳

我正在进行文本分类,并且正在处理奇怪的结果。我有两个数据集,一个被标记,另一个未被标记。当我使用一些分类器(SVM,朴素贝叶斯,knn,随机森林,...

回答 1 投票 0

在Python / PySpark中找不到模块'preproc'

我正在尝试遵循本教程:https://runawayhorse001.github.io/LearningApacheSpark/textmining.html我已经将数据加载到PySpark DataFrame中,但是当我进入预处理步骤时,...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.