scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。
我有 9000 个美国积分(即账户),具有各种不同的字符串和数字列/属性。我正在尝试将这些积分/帐户均匀地划分为公平的分组......
我正在尝试使用 GaussianProcessRegressor 作为 scikit-learn 0.18.1 的一部分 我正在训练 200 个数据点,并为我的内核使用 13 个输入特征 – 一个常数乘以径向基
为什么average_ precision_score会忽略y_true = 0的预测?
考虑这个例子: 将 numpy 导入为 np 从 sklearn 导入指标 y_true = np.array([[1, 1, 1],[0, 0, 0],[0, 0, 0]]) y_pred = np.array([[1, 1, 1],[.9, .9, .9],[.8, .8, .8]]) aps = 指标。
我有一个如下所示的数据集。 年 季度 数量 价格 2000年1月23日142 2000年2月23日144 2000年3月23日147 2000年4月23日151 2001年1月22日160 2001年2月22日183 20...
我有一个包含 DateTime 索引的数据集,我正在使用 sklearn 中的 PCA 来减少维数。 下面的问题让我烦恼 - PCA 会保持我的系列中点的顺序吗...
如何解决:类型错误:fit() 缺少 1 个必需的位置参数:'y'
# 决策树 从 sklearn.tree 导入 DecisionTreeClassifier clf = 决策树分类器() clf = DecisionTreeClassifier.fit(X_train, y_train) y_pred = DecisionTreeClassifier.predict(X_test) ...
我已经用 python 训练了一个 XGboost 模型,并将概率列表作为输出。如何将这些概率引入原始数据集,以便在一个 DF 中拥有数据 + 预测值? ...
所以我目前有一个包含很多客户变压器的管道: p = 管道([ ("GetTimeFromDate",TimeTransformer("Date")), 添加 ["time"] 列的#Custom Transformer (“获取ZipFrom地址”,
我有一个包含 500 个类的 LabelEncoder。 为了存储和加载它,我使用了 pickle: 以 open('../data/label_encoder_v500.pkl', 'rb') 作为文件: label_encoder = pickle.load(文件) 我想添加 24 个新 c...
如何将 LabelEncoder 应用于 Polars DataFrame 列?
我正在尝试使用 scikit-learn 的 LabelEncoder 和 Polars DataFrame 来对分类列进行编码。这是我的代码: 从 sklearn.preprocessing 导入 LabelEncoder le = 标签编码器() SO = pl.
有没有办法将单个LightGBM决策树(决策规则)转换为Python代码(条件语句)?
我正在尝试将单个 LightGBM 决策树(即 num_boost_round = 1 和 num_leaves = 16)转换为 Python 条件语句。有办法做到这一点吗?我在 stackoverflow 上找到了一篇关于
我正在尝试使用 scikit-learn 的监督学习方法之一将文本片段分类为一个或多个类别。我尝试过的所有算法的预测函数都只返回一个匹配项...
让我们看看以下管道: 缩放器 = ScalerFactory.get_scaler(scaler_type) model = MultiOutputRegressor(lgb.LGBMRegressor(metric='tweedie', **超参数)) 步骤 = [('缩放器', 缩放器), ('...
不支持多标签指示器是我在尝试运行时收到的错误消息: 你能给我任何解决方案或提示吗? 将seaborn导入为sns sns.heatmap(confusion_matrix(y_test, y_pred), annot =
传递了稀疏矩阵,但需要密集数据。使用 X.toarray() 转换为密集 numpy 数组
代码如下,我尝试使用 GBRT 回归树的训练数据,相同的数据适用于其他分类器,但对于 GBRT 给出上述错误。请帮忙: 数据集 = load_files('tra...
我想非常准确地回归一个与单个变量 x 非线性相关的目标。在我的 sklearn 管道中,我使用: 管道 = 管道([('poly', PolynomialFeatures(3, include_bias=False)), ...
无法在 ubuntu 24.04 上安装 scikit-learn
我一直在试图弄清楚是否有办法在虚拟环境之外的我的ubuntu 24.04(我使用的是python 3.12.3)上下载scikit-learn。我还创建了一个虚拟环境...
我想要一些可以告诉我应该对数据中的某些 ID 执行哪些操作的东西。例如,我们应该更新还是忽略“xyz”类型的 ID?这个选择应该是
将 KDE 与 scikitlearn 和 pandas 进行拟合会导致分布超出数据范围
我正在使用 scikit-learn KDE 函数和 Pandasplot.kde 对一组数据拟合从 1 到 13 的分数分布。 我已经使用 gridsearchCV 方法设置了带宽。然而,当
DecisionTreeRegressor 'tree_' 属性文档(Tree 类)
我试图找到有关“Tree”类的文档,该类是“DecisionTreeRegressor”的“tree_”参数的类,但没有成功。 有人知道这个类是否有记录吗...