scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

scikit-learn 分类器和回归器缓存训练数据?

我有大约 22,000 行训练数据。 我使用 train_test_split 来获取训练和测试数据。 我进行拟合,然后使用各种方法或估计来了解拟合的效果......

回答 1 投票 0

导入错误:无法从“sklearn.base”导入名称“MultiOutputMixin”

我只想用 scikit-learn 进行线性回归。当我尝试导入线性模型包时,出现标题中的错误消息。 我尝试从类似的问题中找到解决方案...

回答 9 投票 0

无法使用sklearn重现训练和测试的分割

我通过 Anaconda Navigator 使用 Jupyter Notebook 版本 5.6.0。我正在尝试将数据集拆分为训练和测试,但每当我关闭并重新打开笔记本并重新运行代码时,它都会创建...

回答 2 投票 0

Scikit train_test_split 按索引

我有一个按日期索引的熊猫数据框。我们假设从 1 月 1 日到 1 月 30 日。我想将此数据集拆分为 X_train、X_test、y_train、y_test 但我不想混合日期,所以我想要 t...

回答 2 投票 0

为什么我的数据没有正确连接?

我在预处理后使用train_test_split分割数据: 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...

回答 1 投票 0

sklearn 具有不平衡类别的逻辑回归

我正在用Python中的sklearn逻辑回归解决分类问题。 我的问题是一个普遍/通用的问题。 我有一个包含两个类/结果(正/负或 1/0)的数据集,但是...

回答 2 投票 0

解释了 scikit-learn MDS 的差异

有没有办法从 scikit learn 的 MDS 计算解释方差(特征值)?我看过这个帖子,但我认为 scikit learn 的 MDS 是 MDS 的“非经典”形式,所以我猜......

回答 1 投票 0

如何对多个特征应用多个估计器来选择具有最高 f1 分数的组合?

我想对多个特征使用多个估计器算法运行递归特征消除,并在测试数据上保留最高的 f1 分数组合。 而不是审查...

回答 1 投票 0

使用sklearn-1.5:10环境部署Azure ML模型时出现Numpy依赖错误

我正在使用 sklearn-1.5(版本 10)环境来部署使用 sklearn.ensemble._forest.RandomForestClassifier 的 ML 模型。部署端点时,我不断遇到依赖性问题......

回答 1 投票 0

scikit-learn 树中奇怪的信息排序

绘制 scikit-learn 树时(以虹膜数据为例),如以下代码所示: 从 sklearn.datasets 导入 load_iris 从 sklearn 导入树 虹膜 = load_iris() X, y = iris.data, iris.target...

回答 1 投票 0

时间序列模型中的递归一步预测

我正在尝试为随机森林模型实现一种递归一步预测方法。 这个想法是以迭代的方式获得 12 个月的预测,其中每个预测都成为 h...

回答 1 投票 0

如何将导出的sklearn训练树应用到测试数据

从sklearn.tree导入DecisionTreeRegressor,export_text cols_X = ['f1', 'f2'] df_train = pd.DataFrame([[1, 3, 4], [2, 5, 1], [7, 8, 7]], columns=['f1', 'f2', '标签']) df_test = pd.DataFrame([...

回答 1 投票 0

禁用内部 scikit 输入验证检查

在底层,Scikit-Learn 会执行此处定义的大量输入验证检查,例如检查 (X,y) 形状、预期标量/数组、确保估计器已安装等。设计时...

回答 1 投票 0

k-NN GridSearchCV 执行时间极长

我正在尝试使用 sklearn 在 MNIST 分类任务上训练 KNN 模型。当我尝试使用 sklearn 的 GridSearchCV 或 RandomizedSearchCV 类调整参数时,我的代码是......

回答 1 投票 0

为什么我的数据没有正确连接

我在预处理后使用训练测试分割来分割数据。 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...

回答 1 投票 0

为什么我的数据没有正确连接

我在预处理后使用训练测试分割来分割数据。 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...

回答 1 投票 0

yellowbrick 实现错误 - AttributeError:“LogisticRegression”对象没有属性“fig”

我是 Yellowbrick 的新用户。在 Yellowbrick ClassificationReport 中实现 sklearn LogisticRegression API 时,我发现了一些不寻常的错误。我已经按照

回答 1 投票 0

如何找到 k-NN 的最佳 k 值?

我有 4 个不同的数据集,每个数据集包含属于两个类之一的二维样本:1 或 2。每个样本的类标签(1 或 2)位于最后一列...

回答 1 投票 0

在 scikit-learn 中使用 NSL-KDD 数据集进行超参数优化以提高分类精度

我正在使用 NSL-KDD 数据集,我的任务是使用 scikit-learn 提高分类算法的准确性。具体来说,我有兴趣获得更多的准确度分数...

回答 1 投票 0

sklearn:获取点到最近聚类的距离

我正在使用 DBSCAN 等聚类算法。 它返回一个名为 -1 的“簇”,这些点不属于任何簇。对于这些点,我想确定从它到新点的距离...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.