text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

提高邮件分类的准确性?

我正在建立一个邮件分类模型。目前,我在数据的预处理过程中使用了NLTK的stopwords和lemmatization。以下是我正在使用的TF-IDF向量器的参数 ...

回答 1 投票 0

多标签分类中的Spacy TextCat Score。

在spacy的文本分类 train_textcat例子中,指定了两个标签Positive和Negative。因此,猫的得分表示为cats = [{"POSITIVE": bool(y), "NEGATIVE": not ...

回答 1 投票 0

如何从一个来自Monkeylearn的API响应的python子列表中只提取一个特定的值。

我一直在Monkeylearn中训练一个文本分类模型,作为我的API查询的响应,我得到一个python列表作为结果。我想只提取特定的文本分类值,从 ...

回答 1 投票 0

使用tensorflow进行句子分类实现HuggingFace BERT

我正在尝试使用Hugging face bert模型对推文进行分类来训练实际灾难推文预测模型(Kaggle竞赛)。我遵循了许多教程,并使用了...

回答 1 投票 0


删除停用词并仅选择熊猫中的名字

我正在尝试按日期提取热门单词,如下所示:df.set_index('Publishing_Date')。Quotes.str.lower()。str.extractall(r'(\ w +)')[0] .groupby( 'Publishing_Date')。value_counts()。groupby('Publishing_Date')...

回答 1 投票 1

如何使用Tf-idf功能训练模型?

从sklearn.feature_extraction.text导入TfidfVectorizer tfidf = TfidfVectorizer(sublinear_tf = True,min_df = 5,范数='l2',...

回答 1 投票 1

如何计算具有十个特征的数据集的信息增益和熵?

我有一个10K的数据集,并且创建了以下十个特征:距离-(0或1)IsPronoun-(真或假)字符串匹配-(真或假)说明性NP-(如果i和j为说明性则为真...

回答 1 投票 -1

sklearn如何使用保存的模型来预测新数据

我使用sklearn训练了一个SVM文本分类器,并使用tf-idf(TfidfVectorizer)提取了特征。现在,我需要保存模型并加载它,以预测看不见的文本。我将模型加载到另一个...

回答 1 投票 0

Mutli-Class文本分类(使用TFIDF和SVM)。如何实现一个反馈可能属于多个类别的场景?

我有一个原始反馈文件,需要对其进行标记(分类),然后作为SVM分类器(或与此相关的任何分类器)的训练输入。但是要注意的是,我没有分配...

回答 1 投票 1

如何在spaCy中改进德语文本分类模型

我正在研究一个文本分类项目,并为此使用了spacy。现在,我的准确度几乎等于70%,但这还不够。我一直在尝试改进过去两个模型...

回答 1 投票 0

未定义名称'doc2vec'

我正在尝试使用doc2vec进行文本分类,但是在导入后,当我试图在一个函数中使用它时,它说doc2vec未定义。请帮助我确定所有库...

回答 2 投票 0

从多类分类算法输出前2类

我正在研究文本的多类分类问题,其中我有很多不同的类(超过15个)。我已经训练了Linearsvc svm方法(方法只是示例)。但是它只输出...

回答 1 投票 0

使用 CreateML 创建文本分类器模型时收到,“抛出错误但未被捕获:提供的验证数据必须包含...”

我正在使用 Playground 使用 CreateML 创建文本分类器模型并不断收到错误消息: 游乐场执行终止:抛出错误但未被捕获: ▿ 验证数据公关...

回答 3 投票 0

sklearn:调用naive_bayes.MultinomialNB(

我已经看过类似的问题。但是,在我的情况下,上述解决方案均无效。我正在尝试建立文本分类预测模型。 def train_model(classifier,...

回答 1 投票 0

FastText调用是'nan',但精度是一个数字

我使用Python界面在FastText中训练了一个受监督的模型,但由于精度和召回率,我得到了奇怪的结果。首先,我训练了一个模型:model = fasttext.train_supervised(“ train.txt”,...

回答 1 投票 1

用于通过推文预测性别的文本分类器

我正在尝试建立文本分类器,以根据Twitter用户的推文来预测其性别。这是我第一次构建文本分类模型,我不确定要执行的步骤。两个...

回答 1 投票 0

用于分类covid-19论文的神经网络

首先,很抱歉我的英语写作能力很差。我的作业是从头开始实现一个人工神经网络,以根据标题对covid-19数据挖掘论文进行分类,...

回答 1 投票 0

Sklearn的多标签文本分类

为了解决Python中的多标签文本分类,我已经尝试了所有可以想到的方法,非常感谢您的帮助。我在这里使用...

回答 1 投票 0

使用Python进行多标签文本分类

为了解决Python中的多标签文本分类,我已经尝试了所有可以想到的方法,非常感谢您的帮助。我在这里使用...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.