text-classification 相关问题

简单地说,文本分类就是将一段文本放入一组(主要是预定义的)类别中。这是许多现实世界应用中出现的最重要问题之一。例如,文本分类的一个示例是自动呼叫中心,其希望将投诉自动分类到最合适的问题桶中。

适合客观/主观分类的数据集?

我想用预训练的 BERT 模型进行客观性和主观性分类。 例如: 客观句:乔拜登是美国第46任总统。 主观句子...

回答 0 投票 0

使用 scikit-learn 对文本进行标记

我有以下代码从一组文件(文件夹名称是类别名称)中提取特征以进行文本分类。 导入 sklearn.datasets 从 sklearn.feature_extraction.text 导入

回答 2 投票 0

ParserError:错误标记数据。在 SMSA indoBert 教程中

我正在尝试使用 DocumentSentimentDataset 和 DocumentSentimentDataLoader 制作简单的训练、验证和测试数据,但出现此错误 /usr/local/lib/python3.8/dist-packages/pandas/_libs/

回答 0 投票 0

为什么 TextCNN 运行这么慢?

当我使用 TextCNN 进行文本分类时,我发现对于相同的输入,它比 LSTM 慢了将近 10 倍。这是正常的吗?设置 mini-batch 为 32,训练 CNN 100 需要一个多小时

回答 0 投票 0

文本分类——35+类;每个班级只有 ~100 个样本

我有一个有趣的问题,我一直在努力解决。 这个任务看起来很简单——给定一个类列表和一些属于类的样本/规则,分配所有相关...

回答 0 投票 0

ValueError: 类的数量必须大于1;得到1个类。

SVM = svm.SVC(C=1.0,kernel='线性',degree=3,gamma='auto') SVM.fit(Train_X_Tfidf,Train_Y) predictions_SVM = SVM.predict(Test_X_Tfidf) print("SVM Accuracy Score ->",accounteracy_score(...

回答 1 投票 0

如何使用Keras创建一个BERT层?

我正在尝试使用一个BERT层来将文本评论分为正面或负面。# 类似于教程。# https:/towardsdatascience.combert-in-keras-with-tensorflow-hub-76bcbc9417b # 确保... ...

回答 1 投票 0

RoBERTa 分类 RuntimeError: shape '[-1, 9]' 对于大小为 8 的输入无效。

m = MultiLabelBinarizer() X = pd.read_csv('datadata.csv', sep=None, engine='python') X = X.dropna() Y_train = m.fit_transform(X['label']) Y_train2 = [list(i) for i in Y_train] ...

回答 1 投票 0

天真贝叶斯函数的下标出界错误。

我正在创建一个用户定义的奈夫贝叶斯函数,在这里我显示了准确率、错误分类和召回率。我还没有对召回率进行编码。帮助将非常感激以下是我的代码为Naive ...

回答 1 投票 0

准确率和预测分类器

我已经在我的数据集上训练了LSTM和决策树(文本分类的类型)。我使用K-cross fold验证,k=10。决策树准确率61% LSTM准确率90% 现在当我预测...

回答 1 投票 -1

如何在tensorflow上修复文本分类的学习率?

我一直在用 tensorflow keras 编码情感分析模型,我使用的是 csv 数据集,其中第 1 行有标签(pos:1, neg:0),第 2 行有英文文本。我使用csv数据集,其中第1行是标签(pos:1, neg:0),第2行是英文文本。 我期望的结果是显示数字 ...

回答 1 投票 1

文本分类的SkLearn模型

我有一个分类器多类,使用Sklearn库提供的LinearSVC模型进行训练。这个模型提供了一个decision_function方法,我用numpy库的函数来解释 ...

回答 3 投票 3

使用sklearn预测新内容的文本群集。

我想了解如何使用sklearn创建文本的聚类。我有800百个文本(600个训练数据和200个测试数据),如下所示。文本#列名称1唐纳德-特朗普,... ...

回答 1 投票 1

预期字节或单码字符串

我一直在尝试做文本分类。有2列行动和类别。我已经把数据集分为训练和测试分裂.有某种np.nan是一个无效的文件,预计... ...

回答 1 投票 0

在文本分类的任务中,如何编写管道的特征提取器类?

我在做一个文本作者归属模型。分类器是SVM(线性核),我想使用sklearn.model_selection中的cross_val_score进行评估。问题是如何反馈到 ...

回答 1 投票 0

如何在TensorFlow 2.0中优化微调后BERT的模型大小?

在对分类的BERT进行微调后,模型大小是~1.3GB,而预训练的模型大小是~400MB。这种情况的发生是由于模型中保存了与Adam相关的附加变量,可以 ...

回答 1 投票 0

替代品TfidfVectorizer

有什么办法可以替代sklearn.feature_extraction.text模块的TfidfVectorizer功能吗?我听说过fastText和GloVe,但是没有找到一个好的解释如何使用它来矢量化......

回答 1 投票 0

使用fastText进行文本分类的文本预处理。

对于使用fastText进行监督文本分类,什么样的文本预处理能产生最好的效果?官方文档显示只有一个简单的预处理,包括小写字母和 ...

回答 1 投票 0

如何使用卷积神经网络(python)构建深度学习文本分类器?

我需要采取哪些步骤来构建一个深度学习文本分类器,更具体地说,是在一组未标记的文本中识别作者(作者归属)的文本分类器? ...

回答 1 投票 1

提高邮件分类的准确性?

我正在建立一个邮件分类模型。目前,我在数据的预处理过程中使用了NLTK的stopwords和lemmatization。以下是我正在使用的TF-IDF向量器的参数 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.