在机器学习和统计中,分类是基于包含其类别成员(标签)已知的观察的训练数据集来识别新观察所属的一组类别中的哪一个的问题。
如何使用预先计算的距离矩阵来使用 KNeighborsClassifier?
我需要使用 scikit-learn 中的 KNeighborsClassifier 类对数据集进行分类。在文档中它说你可以使用预先计算的距离矩阵,但我已经尝试过了,它给出了 m...
所以这是一个2D形状识别问题。 搜索以下形状类别进行分类: 圆形、半圆形、四分之一圆、三角形、正方形、长方形、 梯形、五边形、六边形、
bert 模型显示 TypeError:Layer input_spec 必须是 InputSpec 的实例。得到:InputSpec(shape=(None, 55, 768), ndim=3)
我正在尝试使用bert预训练模型进行意图分类。这是我在 jupyter notebok 中的代码。 数据准备类: 文本列=“文本” label_column =“意图...
如何在没有额外列的情况下实现 scikit-learn 混淆矩阵?
我有一个可以进行二元分类的分类器。对于训练,我使用我信任的数据。 为了进行测试,我使用了我信任的数据以及一些不太好的数据(真实世界数据)。 我如何获得会议...
我需要一个带有huber损失函数的python svm分类器。但它的默认损失函数是铰链损失。你知道如何将损失函数分配给 python svm 吗? svc = svm.SVC(kernel='线性', C=1,
我对机器学习模型中的缩放概念有点困惑。 在分类中,如果变量具有不同的尺度,我通常对自变量进行缩放并且......
我正在研究神经网络,或更具体地说,目前正在研究图像分类。当我阅读时,我想知道以下内容是否已经完成/可行。如果有人能指点我...
我正在创建一个用于皮肤病变分类的 CNN。 我最近在我的模型中添加了一个权重损失函数,以尝试提高其准确性,但即使有了新的加权损失,我的模型仍然只是
我正在尝试获取可能重叠的产品属性。 给定标题、制造商、描述,我需要知道该产品是牛仔裤还是其他东西,甚至更多,是否……
我正在使用 fasttext 模型来预测文本标签。 通常 fasttext 可以在单词级别对文本进行分类,例如: 模型 = fasttext.train_supervised(input="training_fasttextFormat.csv", lr=0...
我目前正在构建一个用于参与度检测的视频分类模型,但在训练它时遇到了一些麻烦。该模型采用两个张量作为输入:一个 10x48x48x1 张量,其中包含一个 sta...
我有兴趣在RCV1数据集上应用KNN、GP、MLP等分类算法进行主题分类。然而,这个数据集非常大,维度为 (804414, 472...
我正在训练一个逻辑分类器,调用分类器后,我似乎无法拟合训练数据。这就是我得到的。 # 调用分类器 来自 sklearn. Linear_model
我的任务是实现这里讨论的架构。我目前正在实现一个子网络,其中输入张量的形状为 (N, T/4, 832),其中 T 是时间。子网络由 &q...
我正在使用 sklearn 进行分类预测模型,并不断收到相同的错误“支持的目标类型是:('二元','多类')
我正在使用以下分类模型: 线性回归 逻辑回归 K邻居分类器 决策树分类器 我正在尝试制作一些预测模型,每次我尝试......
我需要对一些数据进行分类(R xgboost 或 catboost 等),这些数据共有大约 30 个输入变量。数据集变量之一是因子变量,有 100 个可能的级别(&qu...
我有一个 $N imes T$ 矩阵,其中 $N$ 是观察次数,$T$ 是我的特定算法的迭代次数。 对于每次迭代,我使用的函数都会给我一个
在nlpManger中我们可以添加文档如下 manager.addDocument('en', '我看到 %hero% 吃 %food%', 'sawhero'); 我如何手动添加值,以便我可以更好地控制最终的
考虑这样一种情况,标记数据的数量为0 = 1400,标记为1 = 100。标记为0的数据表示正常工作情况,标记为1的数据表示异常。警报是
sklearn HistGradientBoostingClassifier 具有大量不平衡数据
我一直在使用 Sklearn HistGradientBoostingClassifier 对一些数据进行分类。我的实验是使用单标签预测(20 个标签)的多类分类。 我的经历有两种情况。