scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。
我正在尝试使用 pip 命令安装 sklearn 模块,但安装完成后,我只能看到这个文件夹 C:\Users\Aditi\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.
我想绘制一个混淆矩阵来可视化分类器的性能,但它仅显示标签的数量,而不显示标签本身: 从sklearn.metrics导入confusion_matrix 小鬼...
我注意到我可以在随机森林分类器中设置随机状态,但不能在补朴素贝叶斯中设置。我收到错误 类型错误:__init__() 得到意外的关键字参数“random_state” 我认为这是
如何使用 sklearn minmaxscaler 有条件缩放
我有一列有正值、0 值和负值。具有 0 值的行构成数据帧的 90%。我想缩放此列,但不触及 0 值行。仅那些没有...的行
我有一个神经网络,适用于我在教程中找到的一个数据集。过去 48 小时我一直在研究代码,它运行得很好。但现在,我想测试其他数据集,但失败了。它...
我有 9000 个美国积分(即账户),具有各种不同的字符串和数字列/属性。我正在尝试将这些积分/帐户均匀地划分为公平的分组......
我正在尝试使用 GaussianProcessRegressor 作为 scikit-learn 0.18.1 的一部分 我正在训练 200 个数据点,并为我的内核使用 13 个输入特征 – 一个常数乘以径向基
为什么average_ precision_score会忽略y_true = 0的预测?
考虑这个例子: 将 numpy 导入为 np 从 sklearn 导入指标 y_true = np.array([[1, 1, 1],[0, 0, 0],[0, 0, 0]]) y_pred = np.array([[1, 1, 1],[.9, .9, .9],[.8, .8, .8]]) aps = 指标。
我有一个如下所示的数据集。 年 季度 数量 价格 2000年1月23日142 2000年2月23日144 2000年3月23日147 2000年4月23日151 2001年1月22日160 2001年2月22日183 20...
我有一个包含 DateTime 索引的数据集,我正在使用 sklearn 中的 PCA 来减少维数。 下面的问题让我烦恼 - PCA 会保持我的系列中点的顺序吗...
如何解决:类型错误:fit() 缺少 1 个必需的位置参数:'y'
# 决策树 从 sklearn.tree 导入 DecisionTreeClassifier clf = 决策树分类器() clf = DecisionTreeClassifier.fit(X_train, y_train) y_pred = DecisionTreeClassifier.predict(X_test) ...
我已经用 python 训练了一个 XGboost 模型,并将概率列表作为输出。如何将这些概率引入原始数据集,以便在一个 DF 中拥有数据 + 预测值? ...
所以我目前有一个包含很多客户变压器的管道: p = 管道([ ("GetTimeFromDate",TimeTransformer("Date")), 添加 ["time"] 列的#Custom Transformer (“获取ZipFrom地址”,
我有一个包含 500 个类的 LabelEncoder。 为了存储和加载它,我使用了 pickle: 以 open('../data/label_encoder_v500.pkl', 'rb') 作为文件: label_encoder = pickle.load(文件) 我想添加 24 个新 c...
如何将 LabelEncoder 应用于 Polars DataFrame 列?
我正在尝试使用 scikit-learn 的 LabelEncoder 和 Polars DataFrame 来对分类列进行编码。这是我的代码: 从 sklearn.preprocessing 导入 LabelEncoder le = 标签编码器() SO = pl.
有没有办法将单个LightGBM决策树(决策规则)转换为Python代码(条件语句)?
我正在尝试将单个 LightGBM 决策树(即 num_boost_round = 1 和 num_leaves = 16)转换为 Python 条件语句。有办法做到这一点吗?我在 stackoverflow 上找到了一篇关于
我正在尝试使用 scikit-learn 的监督学习方法之一将文本片段分类为一个或多个类别。我尝试过的所有算法的预测函数都只返回一个匹配项...
让我们看看以下管道: 缩放器 = ScalerFactory.get_scaler(scaler_type) model = MultiOutputRegressor(lgb.LGBMRegressor(metric='tweedie', **超参数)) 步骤 = [('缩放器', 缩放器), ('...
不支持多标签指示器是我在尝试运行时收到的错误消息: 你能给我任何解决方案或提示吗? 将seaborn导入为sns sns.heatmap(confusion_matrix(y_test, y_pred), annot =
传递了稀疏矩阵,但需要密集数据。使用 X.toarray() 转换为密集 numpy 数组
代码如下,我尝试使用 GBRT 回归树的训练数据,相同的数据适用于其他分类器,但对于 GBRT 给出上述错误。请帮忙: 数据集 = load_files('tra...