scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。
我有大约 22,000 行训练数据。 我使用 train_test_split 来获取训练和测试数据。 我进行拟合,然后使用各种方法或估计来了解拟合的效果......
导入错误:无法从“sklearn.base”导入名称“MultiOutputMixin”
我只想用 scikit-learn 进行线性回归。当我尝试导入线性模型包时,出现标题中的错误消息。 我尝试从类似的问题中找到解决方案...
我通过 Anaconda Navigator 使用 Jupyter Notebook 版本 5.6.0。我正在尝试将数据集拆分为训练和测试,但每当我关闭并重新打开笔记本并重新运行代码时,它都会创建...
我有一个按日期索引的熊猫数据框。我们假设从 1 月 1 日到 1 月 30 日。我想将此数据集拆分为 X_train、X_test、y_train、y_test 但我不想混合日期,所以我想要 t...
我在预处理后使用train_test_split分割数据: 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...
我正在用Python中的sklearn逻辑回归解决分类问题。 我的问题是一个普遍/通用的问题。 我有一个包含两个类/结果(正/负或 1/0)的数据集,但是...
有没有办法从 scikit learn 的 MDS 计算解释方差(特征值)?我看过这个帖子,但我认为 scikit learn 的 MDS 是 MDS 的“非经典”形式,所以我猜......
如何对多个特征应用多个估计器来选择具有最高 f1 分数的组合?
我想对多个特征使用多个估计器算法运行递归特征消除,并在测试数据上保留最高的 f1 分数组合。 而不是审查...
使用sklearn-1.5:10环境部署Azure ML模型时出现Numpy依赖错误
我正在使用 sklearn-1.5(版本 10)环境来部署使用 sklearn.ensemble._forest.RandomForestClassifier 的 ML 模型。部署端点时,我不断遇到依赖性问题......
绘制 scikit-learn 树时(以虹膜数据为例),如以下代码所示: 从 sklearn.datasets 导入 load_iris 从 sklearn 导入树 虹膜 = load_iris() X, y = iris.data, iris.target...
我正在尝试为随机森林模型实现一种递归一步预测方法。 这个想法是以迭代的方式获得 12 个月的预测,其中每个预测都成为 h...
从sklearn.tree导入DecisionTreeRegressor,export_text cols_X = ['f1', 'f2'] df_train = pd.DataFrame([[1, 3, 4], [2, 5, 1], [7, 8, 7]], columns=['f1', 'f2', '标签']) df_test = pd.DataFrame([...
在底层,Scikit-Learn 会执行此处定义的大量输入验证检查,例如检查 (X,y) 形状、预期标量/数组、确保估计器已安装等。设计时...
我正在尝试使用 sklearn 在 MNIST 分类任务上训练 KNN 模型。当我尝试使用 sklearn 的 GridSearchCV 或 RandomizedSearchCV 类调整参数时,我的代码是......
我在预处理后使用训练测试分割来分割数据。 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...
我在预处理后使用训练测试分割来分割数据。 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...
yellowbrick 实现错误 - AttributeError:“LogisticRegression”对象没有属性“fig”
我是 Yellowbrick 的新用户。在 Yellowbrick ClassificationReport 中实现 sklearn LogisticRegression API 时,我发现了一些不寻常的错误。我已经按照
我有 4 个不同的数据集,每个数据集包含属于两个类之一的二维样本:1 或 2。每个样本的类标签(1 或 2)位于最后一列...
在 scikit-learn 中使用 NSL-KDD 数据集进行超参数优化以提高分类精度
我正在使用 NSL-KDD 数据集,我的任务是使用 scikit-learn 提高分类算法的准确性。具体来说,我有兴趣获得更多的准确度分数...
我正在使用 DBSCAN 等聚类算法。 它返回一个名为 -1 的“簇”,这些点不属于任何簇。对于这些点,我想确定从它到新点的距离...