scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

我如何正确设置“random_state”以使我的结果始终相同?

如果我有以下代码片段: knn = KNeighborsClassifier() grid_search_knn = GridSearchCV( 估计量=knn, n_工作=-1) 我必须这样设置吗: knn = KNeighborsClassifier(

回答 2 投票 0

我如何正确设置“random_state”以使我的结果始终相同? (蟒蛇,sklearn)

如果我有以下代码片段: knn = KNeighborsClassifier() grid_search_knn = GridSearchCV( 估计量=knn, n_职位=-1 ) 我必须这样设置吗 1.: knn =

回答 1 投票 0

sklearnmutual_info_classif 根据特征顺序返回不同的值

我注意到 sklearnmutual_info_classif 函数中的行为与我在互信息目标中的预期不一致。 给定一组列 ['A', 'B', 'C'] 和一个从属

回答 2 投票 0

如果我在Python管道中有一个定制的集成模型,如何进行交叉验证和网格搜索

我正在构建一个定制的集成模型,并且想使用管道在Python中进行交叉验证和网格搜索。我该怎么做呢? 我有一个包含网页内容的数据集。我想做的事...

回答 2 投票 0

超过 2 个分类器的管道

我正在尝试使用 Knn 和随机森林分类器构建一个集成。 步骤 = [('scaler', StandardScaler()), ('回归', VotingClassifier(估计器=[ ('knn', KNeighborsClassifier()...

回答 1 投票 0

scikit-learn 分类器和回归器缓存训练数据?

我有大约 22,000 行训练数据。 我使用 train_test_split 来获取训练和测试数据。 我进行拟合,然后使用各种方法或估计来了解拟合的效果......

回答 1 投票 0

导入错误:无法从“sklearn.base”导入名称“MultiOutputMixin”

我只想用 scikit-learn 进行线性回归。当我尝试导入线性模型包时,出现标题中的错误消息。 我尝试从类似的问题中找到解决方案...

回答 9 投票 0

无法使用sklearn重现训练和测试的分割

我通过 Anaconda Navigator 使用 Jupyter Notebook 版本 5.6.0。我正在尝试将数据集拆分为训练和测试,但每当我关闭并重新打开笔记本并重新运行代码时,它都会创建...

回答 2 投票 0

Scikit train_test_split 按索引

我有一个按日期索引的熊猫数据框。我们假设从 1 月 1 日到 1 月 30 日。我想将此数据集拆分为 X_train、X_test、y_train、y_test 但我不想混合日期,所以我想要 t...

回答 2 投票 0

为什么我的数据没有正确连接?

我在预处理后使用train_test_split分割数据: 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...

回答 1 投票 0

sklearn 具有不平衡类别的逻辑回归

我正在用Python中的sklearn逻辑回归解决分类问题。 我的问题是一个普遍/通用的问题。 我有一个包含两个类/结果(正/负或 1/0)的数据集,但是...

回答 2 投票 0

解释了 scikit-learn MDS 的差异

有没有办法从 scikit learn 的 MDS 计算解释方差(特征值)?我看过这个帖子,但我认为 scikit learn 的 MDS 是 MDS 的“非经典”形式,所以我猜......

回答 1 投票 0

如何对多个特征应用多个估计器来选择具有最高 f1 分数的组合?

我想对多个特征使用多个估计器算法运行递归特征消除,并在测试数据上保留最高的 f1 分数组合。 而不是审查...

回答 1 投票 0

使用sklearn-1.5:10环境部署Azure ML模型时出现Numpy依赖错误

我正在使用 sklearn-1.5(版本 10)环境来部署使用 sklearn.ensemble._forest.RandomForestClassifier 的 ML 模型。部署端点时,我不断遇到依赖性问题......

回答 1 投票 0

scikit-learn 树中奇怪的信息排序

绘制 scikit-learn 树时(以虹膜数据为例),如以下代码所示: 从 sklearn.datasets 导入 load_iris 从 sklearn 导入树 虹膜 = load_iris() X, y = iris.data, iris.target...

回答 1 投票 0

时间序列模型中的递归一步预测

我正在尝试为随机森林模型实现一种递归一步预测方法。 这个想法是以迭代的方式获得 12 个月的预测,其中每个预测都成为 h...

回答 1 投票 0

如何将导出的sklearn训练树应用到测试数据

从sklearn.tree导入DecisionTreeRegressor,export_text cols_X = ['f1', 'f2'] df_train = pd.DataFrame([[1, 3, 4], [2, 5, 1], [7, 8, 7]], columns=['f1', 'f2', '标签']) df_test = pd.DataFrame([...

回答 1 投票 0

禁用内部 scikit 输入验证检查

在底层,Scikit-Learn 会执行此处定义的大量输入验证检查,例如检查 (X,y) 形状、预期标量/数组、确保估计器已安装等。设计时...

回答 1 投票 0

k-NN GridSearchCV 执行时间极长

我正在尝试使用 sklearn 在 MNIST 分类任务上训练 KNN 模型。当我尝试使用 sklearn 的 GridSearchCV 或 RandomizedSearchCV 类调整参数时,我的代码是......

回答 1 投票 0

为什么我的数据没有正确连接

我在预处理后使用训练测试分割来分割数据。 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.