scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。
我正在尝试研究 Sklearn 中嵌套 CV 与非嵌套 CV 的示例。我检查了多个答案,但我仍然对这个例子感到困惑。 据我所知,嵌套简历旨在使用
如何在sklearn.preprocessing.MinMaxScaler中设置原始数组的最小值和最大值
我在看 类 sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1), copy=True 其描述如下: 标准化由下式给出: X_std = (X - X.min(axis=0)) / (X.ma...
我正在 Spark 和 Linux 上使用 GridSearchCV (scikit-learn) 执行网格搜索。因此,我在 bash shell 中运行 nohup ./spark_python_shell.sh > output.log & 来启动 Sp...
我在尝试使用 scikit-learn 评估 Python 中的各种回归模型时遇到了问题。我已经实现了一个代码来训练和评估不同的算法,包括 LinearRegr...
从 scikit-learn KDtree.query_radius() 中删除空输出并获取唯一值
我正在尝试压平 scikit-learn KDtree 的输出。我还想在展平数组上调用 np.unique() 。 我拨打的电话是: kd_tree = KDTree(X) idxs = kd_tree.query_radius(Y, r=0.2...
我有一个由特征提取器和 VotingClassifier 组成的 scikit-learn Pipeline,其中包含 MulinomialNB 和其他一些模型。当我单独训练 MulinomialNB 时,我可以提取日志
我有大量数据想要使用 Scikit 的 DBSCAN 进行聚类。我用下面的行来做: dbscanObject = DBSCAN(eps=20, min_samples=15).fit(featureVectors) 不幸的是,这...
我正在尝试使用 YouTube 指南在 Python 中构建 AI 图像分类器。当我运行我的程序(未完成)时,它不会打开图像
我正在尝试使用 YouTube 指南为学校项目构建人工智能图像分类器。这是链接:https://www.youtube.com/watch?v=oEKg_jiV1Ng&t=727s 在这个阶段,我还没有完成,但是...
使用 scikit-learn fit 时,出现错误“预期是二维容器,但得到的是 <class 'pandas.core.series.Series'>。”
您好,我尝试在线查看此错误代码,但找不到有关它的太多信息。我的理解是必须制作一个 X_train 和 Y_train 的数据帧,但我不知道如何......
PowerTransformer 和 QuantileTransformer 都不适用于某个功能
我正在研究著名的自行车共享数据集。目标变量 cnt 的分布严重倾斜。为了方便读者,我也分享了它的发行版。 我想改变它
我已经使用 MinMaxScaler 形式 sklearn 缩放了我的数据集,如下所示: 从 sklearn.preprocessing 导入 MinMaxScaler # 创建一个StandardScaler对象 self.scaler = MinMaxScaler(feature_range=(0, ...
我正在尝试使用 YouTube 指南构建人工智能图像分类器。当我运行我的程序(未完成)时,它不会打开图像。 (Python)
我正在尝试使用 YouTube 指南为学校项目构建人工智能图像分类器。这是链接:https://www.youtube.com/watch?v=oEKg_jiV1Ng&t=727s 在这个阶段,我还没有完成,但是...
如何量化一系列预测的一致性,包括。预测置信度,使用 sklearn 或类似库中的标准函数
假设我对同一对象有一系列类别预测。然后我想测量该序列的一致性。例如,一致的预测序列,如 class_a、class_a、
RandomForestClassifier GridSearchCV 和显式编码的 RandomForestCLassifier 之间的 roc_auc_score 不同
为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...
我正在尝试使用 sklearn 的 AgglomerativeClustering 来优化用于在同一数据集上计算具有不同数量的集群的多个结果的计算时间。 如 s 中所示...
可以使用以下命令创建多元核密度估计 (KDE): scikitlearn(https://scikit-learn.org/stable/modules/ generated/sklearn.neighbors.KernelDensity.html#sklearn.neighbors.KernelDensity...
sklearn ComplementNB:仅对完全可分离数据进行 0 类预测
如下图,下面的平衡的一维数据可以通过sklearn GaussianNB完美分离。为什么 sklearn ComplementNB 给出的分类对于相同的内容全为零......
python sklearn ValueError:使用序列设置数组元素
训练 sklearn sgd 分类器。根据数组中的姓名和年龄,获得颜色。乙 sgdclassifier 的 .fit() 错误。错误:“使用序列设置数组元素。”意思是?母鹿...
如何关闭lightgbm sklearn界面的调试日志输出?尝试过 回归器 = lightgbm.LGBMRegressor(verbose=-1) 不起作用。 回归器.fit(详细=-1) 不被接受。 我发现的是...
sklearn.multiclass.OneVsRestClassifier 中的回调
我想使用回调和eval_set等。 但我有一个问题: 从 sklearn.multiclass 导入 OneVsRestClassifier 导入lightgbm 详细 = 100 参数 = { “目标”:“二进制”...