scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

如何正确安装sklearn模块?

我正在尝试使用 pip 命令安装 sklearn 模块,但安装完成后,我只能看到这个文件夹 C:\Users\Aditi\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.

回答 2 投票 0

sklearn 带标签的混淆矩阵

我想绘制一个混淆矩阵来可视化分类器的性能,但它仅显示标签的数量,而不显示标签本身: 从sklearn.metrics导入confusion_matrix 小鬼...

回答 11 投票 0

我可以为补朴素贝叶斯设置随机状态吗?

我注意到我可以在随机森林分类器中设置随机状态,但不能在补朴素贝叶斯中设置。我收到错误 类型错误:__init__() 得到意外的关键字参数“random_state” 我认为这是

回答 2 投票 0

如何使用 sklearn minmaxscaler 有条件缩放

我有一列有正值、0 值和负值。具有 0 值的行构成数据帧的 90%。我想缩放此列,但不触及 0 值行。仅那些没有...的行

回答 1 投票 0

我的神经网络仅在第一次迭代中工作,然后成本函数返回 NAN

我有一个神经网络,适用于我在教程中找到的一个数据集。过去 48 小时我一直在研究代码,它运行得很好。但现在,我想测试其他数据集,但失败了。它...

回答 1 投票 0

如何创建平衡的k-means地理空间集群?

我有 9000 个美国积分(即账户),具有各种不同的字符串和数字列/属性。我正在尝试将这些积分/帐户均匀地划分为公平的分组......

回答 4 投票 0

sklearn 高斯过程回归器中的优化器调整

我正在尝试使用 GaussianProcessRegressor 作为 scikit-learn 0.18.1 的一部分 我正在训练 200 个数据点,并为我的内核使用 13 个输入特征 – 一个常数乘以径向基

回答 1 投票 0

为什么average_ precision_score会忽略y_true = 0的预测?

考虑这个例子: 将 numpy 导入为 np 从 sklearn 导入指标 y_true = np.array([[1, 1, 1],[0, 0, 0],[0, 0, 0]]) y_pred = np.array([[1, 1, 1],[.9, .9, .9],[.8, .8, .8]]) aps = 指标。

回答 1 投票 0

尝试在数据集中找到最佳价格点

我有一个如下所示的数据集。 年 季度 数量 价格 2000年1月23日142 2000年2月23日144 2000年3月23日147 2000年4月23日151 2001年1月22日160 2001年2月22日183 20...

回答 3 投票 0

应用sklearn时保留pandas索引

我有一个包含 DateTime 索引的数据集,我正在使用 sklearn 中的 PCA 来减少维数。 下面的问题让我烦恼 - PCA 会保持我的系列中点的顺序吗...

回答 3 投票 0

如何解决:类型错误:fit() 缺少 1 个必需的位置参数:'y'

# 决策树 从 sklearn.tree 导入 DecisionTreeClassifier clf = 决策树分类器() clf = DecisionTreeClassifier.fit(X_train, y_train) y_pred = DecisionTreeClassifier.predict(X_test) ...

回答 1 投票 0

如何将预测值合并回数据集?

我已经用 python 训练了一个 XGboost 模型,并将概率列表作为输出。如何将这些概率引入原始数据集,以便在一个 DF 中拥有数据 + 预测值? ...

回答 1 投票 0

如何让FeatureUnion返回Dataframe

所以我目前有一个包含很多客户变压器的管道: p = 管道([ ("GetTimeFromDate",TimeTransformer("Date")), 添加 ["time"] 列的#Custom Transformer (“获取ZipFrom地址”,

回答 2 投票 0

扩展 LabelEncoder 类

我有一个包含 500 个类的 LabelEncoder。 为了存储和加载它,我使用了 pickle: 以 open('../data/label_encoder_v500.pkl', 'rb') 作为文件: label_encoder = pickle.load(文件) 我想添加 24 个新 c...

回答 1 投票 0

如何将 LabelEncoder 应用于 Polars DataFrame 列?

我正在尝试使用 scikit-learn 的 LabelEncoder 和 Polars DataFrame 来对分类列进行编码。这是我的代码: 从 sklearn.preprocessing 导入 LabelEncoder le = 标签编码器() SO = pl.

回答 1 投票 0

有没有办法将单个LightGBM决策树(决策规则)转换为Python代码(条件语句)?

我正在尝试将单个 LightGBM 决策树(即 num_boost_round = 1 和 num_leaves = 16)转换为 Python 条件语句。有办法做到这一点吗?我在 stackoverflow 上找到了一篇关于

回答 1 投票 0

使用scikit-learn分类为多个类别

我正在尝试使用 scikit-learn 的监督学习方法之一将文本片段分类为一个或多个类别。我尝试过的所有算法的预测函数都只返回一个匹配项...

回答 6 投票 0

剪辑 sklearn 管道预测的输出

让我们看看以下管道: 缩放器 = ScalerFactory.get_scaler(scaler_type) model = MultiOutputRegressor(lgb.LGBMRegressor(metric='tweedie', **超参数)) 步骤 = [('缩放器', 缩放器), ('...

回答 1 投票 0

ValueError:不支持多标签指示符混淆矩阵

不支持多标签指示器是我在尝试运行时收到的错误消息: 你能给我任何解决方案或提示吗? 将seaborn导入为sns sns.heatmap(confusion_matrix(y_test, y_pred), annot =

回答 1 投票 0

传递了稀疏矩阵,但需要密集数据。使用 X.toarray() 转换为密集 numpy 数组

代码如下,我尝试使用 GBRT 回归树的训练数据,相同的数据适用于其他分类器,但对于 GBRT 给出上述错误。请帮忙: 数据集 = load_files('tra...

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.