scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

决策树分类器的底层 sklearn“熵”和“log_loss”标准有区别吗?

我正在使用 sklearn 实现决策树分类器并测试不同的标准,但我似乎找不到“熵”和“log_loss”标准之间的区别。

回答 1 投票 0

MSD 算法输出产生“镜像”输出

我正在使用 MSD 算法将 3D 数据点减少为 2D。 在某些情况下,算法返回的结果似乎反映了 y 轴或 x 轴上的原始数据。我会...

回答 1 投票 0

Kmeans 算法的特征缩放

我知道下定义的 KMeans 算法需要特征缩放 sklearn.cluster.KMeans 我的问题是,在使用 KMeans 之前是否需要手动完成,或者 KMeans 会自动执行...

回答 3 投票 0

Python 数据过滤以消除密度图周围的异常值

参考下图,我想删除以黑色椭圆形标记的密度区域之外的所有异常值。我可以使用简单的水平过滤器,例如 -4 < data < 4. But

回答 1 投票 0

在管道中对目标进行标签编码

我想创建一个管道来对训练特征和目标进行预处理,然后训练模型。数据集会是这样的: v1 v2 目标 0 1 是 1 5 c 无 2 3 f ...

回答 1 投票 0

在一个巨大的向量上执行余弦相似度时出现内存错误

我试图使用词袋模型构建一个基于内容的推荐系统。我下面的教程使用 sklearn 库中大小为 (4000,5000) 的向量的余弦相似度...

回答 1 投票 0

如何从 Google Cloud Storage 存储桶加载保存在 joblib 文件中的模型

我想加载一个从 Google Cloud Storage 存储桶保存为 joblib 文件的模型。当它在本地路径时,我们可以按如下方式加载它(考虑model_file是系统中的完整路径):

回答 6 投票 0

Pandas 数据框:合成数据生成

我有一个数据框 df ,其中包含 3 个类(分类问题)。数据包含大多数分类列,并且数据集不平衡。我正在尝试生成合成数据...

回答 2 投票 0

AttributeError:无法设置属性:如何修复这个类才能正常工作?

考虑到 smoteboost.py 文件中的以下 SMOTEBoost 类实现: 导入号码 将 numpy 导入为 np 从集合导入计数器 从 sklearn.base 导入(克隆, ...

回答 1 投票 0

model.compile 损失类型错误:缺少必需的位置参数

最小的例子是 将 numpy 导入为 np 将张量流导入为 tf 从张量流导入keras 从 keras.losses 导入 huber # 创建数据集 x = np.random.rand(10, 1) y = 2 * x + np.random.randn...

回答 1 投票 0

文本分类。 TFIDF 和朴素贝叶斯? [已关闭]

我正在尝试执行文本分类任务,其中有大约 500 条餐厅评论的训练数据,这些评论被标记为 12 个类别。我花费的时间比实施 TF.IDF 的时间要长......

回答 1 投票 0

在 Github Codespace 中安装 scikit-fda 时出错(fdasrsf 构建问题)

我正在尝试在 github 代码空间上的脚本中导入一个库,即 skfda。 该包不存在,所以我尝试 pip install,我尝试 conda,我尝试从 github 克隆 repo ...

回答 1 投票 0

Sklearn 预处理器按顺序工作,但在 Pipeline 中使用时会产生 NA

上下文如下: 我正在使用包含各种特征类型(数字、分类)的数据集。 我的任务是根据定义的目标变量对启动成功进行二元预测

回答 1 投票 0

ValueError:顺序模型“顺序”尚未定义输出

我想用 akerasClassifier 包装模型并运行 model_prediction = model.fit 我收到了几个月前从未遇到过的错误 这是我建造的模型 def create_model(embed_dim = 16,

回答 1 投票 0

仅具有一个数字特征的逻辑回归

当您只有一个数字特征时,使用 scikit-learn 的 LogisticRegression 求解器的正确方法是什么? 我运行了一个我发现很难解释的简单示例。谁能解释一下我是什么

回答 3 投票 0

scikit-learn 1.1.3。 import 无法在 python 中导入名称“METRIC_MAPPING64”

我正在尝试将 scikit-learn 中的线性模型导入到 vscode 中的 python 代码中,并收到意外的错误消息。 导入sklearn 从sklearn导入线性模型 错误: 无法导入名称 '

回答 1 投票 0

多模态数据的自定义朴素贝叶斯实现与 sklearn.naive_bayes

我目前正在使用朴素贝叶斯算法进行一些分类。 为此,通常假设 p(x|C_i) 是高斯分布。在这个假设下,我会假设这个应用程序...

回答 1 投票 0

不平衡学习管道的哪些部分应用于测试集?

我创建了一个由 RobustScaler、SMOTE-NC、RandomUndersampling 和随机森林分类器组成的不平衡学习管道。 RandomSearchCV 用于选择最佳的超参数。 我...

回答 1 投票 0

每个示例使用多个类别对分类特征进行编码

我正在研究一个数据集,该数据集的一个特征是单个示例具有多个类别。 该功能如下所示:- 特征 0 [类别 1、类别 2、类别...

回答 4 投票 0

为什么我的交叉验证始终比训练测试分割表现更好?

我有下面的代码(使用sklearn),首先使用训练集进行交叉验证,并使用测试集进行最终检查。然而,交叉验证始终表现得更好,因为......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.