scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

如何正确设置 scikit-fuzzy trimf 函数的参数

当我尝试手动设置使用trimf函数的参数时,当我尝试输入0时,它会抛出错误。这是重现问题的最小代码 将 numpy 导入为 np 导入skfuzz...

回答 1 投票 0

池多处理的 Python 包装器 |断言错误:数据只能加载一次

我正在尝试在更大的数据集上训练来自 scikit 的相当多的模型(25k-250k 行,约 100 列) 代码看起来像这样 def 工人(参数) X_train,X_test,Y_train,Y_test,

回答 1 投票 0

sklearn“transform_output”设置在 Flask 应用程序上下文和请求上下文中不同

我正在修改一个工作 Flask 应用程序,我一直用它来提供 ML 模型,现在可以通过新的、更新的模型提供预测。 该模型是我训练过的 sklearn 管道对象

回答 1 投票 0

自定义 Scikit-learn 模型持久化

我知道有几种现成的保存模型的方法。 但是我想将模型保存为数据库 blob。 我见过人们从

回答 1 投票 0

为什么我使用线性回归模型预测股票价格时能获得 100% 的准确率?

我正在尝试使用线性回归模型预测Python中的股票价格。我使用 train_test_split 分割数据,因此根据我的理解,我的测试数据不应该在我的训练数据中,所以我......

回答 1 投票 0

如何减少Numpy数据类型的大小

我正在使用Python来做余弦相似度。 相似度矩阵 = 余弦相似度(tfidf_matrix) 问题是我收到这个错误 MemoryError:无法为具有

回答 1 投票 0

如何减少Python数据类型的大小

我正在使用python来做cosine_similarity 相似度矩阵 = 余弦相似度(tfidf_matrix) 问题是我收到这个错误 MemoryError:无法为数组分配 44.8 GiB...

回答 1 投票 0

如何在二维图上可视化不同特征组合的虹膜数据集

我想用所有六种组合(萼片宽度-萼片长度)、(花瓣宽度-萼片长度)、(萼片长度-花瓣宽度)、(花瓣长度-花瓣宽度)(花瓣长度)以二维方式可视化虹膜数据集-se...

回答 2 投票 0

如何将多个观测值拟合到单个高斯过程

我正在尝试将多个观测结果拟合到单个高斯过程中。 我尝试像这样拟合两个观察值(Y)的数据: 将 numpy 导入为 np 从 sklearn.gaussian_process 导入

回答 1 投票 0

忽略NaN来计算mean_absolute_error

我正在尝试计算 MAE(平均绝对误差)。 在我的原始 DataFrame 中,我有 1826 行和 3 列。我使用第 2 列和第 3 列来计算 MAE。 但是,在第 2 列中,我有一些 NaN 值。 什...

回答 1 投票 0

使用 Sklearn 澄清“载荷”的含义

我一直在阅读sklearn中的PCA,特别是特征和组件之间的关系。我对确定几个特征的重要性特别感兴趣

回答 1 投票 0

如何在 sklearn 中应用对数变换和 MinMaxScaler 创建缩放器

我想将 log() 一起应用于我的 DataFrame 和 MinMaxScaler() 。 我希望输出是 pandas DataFrame() ,其中包含原始数据的索引和列。 我想使用以前使用过的参数

回答 1 投票 0

Python中安装和使用scikit-learn的问题

我想在jupyter-notebook中运行以下代码 从 sklearn.linear_model 导入 SGDRegressor 在此之前,我在 Windows cmd 中使用了以下几行: python -m venv sklearn-env sklearn-env\

回答 1 投票 0

无法将数据帧列转换为 int64 数据类型

我有一个问题。 在我的 Pandas DataFrame 中,我有一个名为“job”列的列。我创建了一个简单的自定义转换器,它将映射该列中与作业类型相对应的值。 ...

回答 1 投票 0

ScikitLearn 模型给出“LocalOutlierFactor”对象没有属性“预测”错误

我是机器学习领域的新手,我已经使用 ScikitLearn 库构建并训练了一个机器学习模型。它在 Jupyter 笔记本中运行得很好,但是当我将此模型部署到 Google Cloud ML 时...

回答 5 投票 0

GridSearchCV - XGBoost - 提前停止

我正在尝试在 XGBoost 上使用 scikit-learn 的 GridSearchCV 进行超参数搜索。在网格搜索期间,我希望它早点停止,因为它大大减少了搜索时间并且(期望)有

回答 4 投票 0

获取功能名称时出现 get_features_name_out 错误

我想知道特征对我的数据的重要性,所以我使用 permutation_importance。当我得到结果时,似乎该功能已经解码,我想使用

回答 1 投票 0

输入和创建虚拟变量后,列丢失。我该如何解决这个问题?

简而言之:输入后,我的列在训练集和测试集之间是不同的。 制作火车、测试数据集的代码 随机状态值 = 0 #定义目标 X = data.drop(columns = '收入', axis=1)...

回答 1 投票 0

如何让 scikit-learn 确保所有预测输出之和应为 100%?

我有一个基于“LinearRegression”回归器的“MultiOutputRegressor”。 我用它来预测 X_data 每行的三个输出(如分类器),它们代表百分比可能性...

回答 1 投票 0

实现GridSearchCV和Pipelines来对KNN算法进行超参数调优

我一直在阅读有关 KNN 算法的超参数调整的内容,并且理解实现它的最佳实践是确保对于每次折叠,我的数据集应该是规范的...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.