scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。
将二次多项式拟合到 p 维数据并计算其梯度和 Hessian 矩阵的最佳方法是什么?
我一直在尝试使用scikit-learn库来解决这个问题。 大致: 从 sklearn.preprocessing 导入多项式特征 从 sklearn. Linear_model 导入 LinearRegression # 制作或...
网格搜索为带有 LOGO 或 LOO 的 best_score 提供 nan,而不是 k 折 CV
我在网格搜索方面遇到了 nan R2 分数问题。 FDODB=pd.read_excel('LOGO.xlsx 最终训练集') 数组 = FDODB.值 X = 数组[:,2:126] Y = 数组[:,1] 复合=数组[:,0] 定标器=标准S...
如何解决错误“Axes”对象没有属性“is_first_col”?
从sklearn.model_selection导入train_test_split,cross_val_score,StratifiedKFold 从 matplotlib 导入 pyplot 从 sklearn.preprocessing 导入 StandardScaler 将 pandas 导入为 pd 导入matp...
在Python中,将二次多项式拟合到p维数据并计算其梯度和Hessian矩阵的最佳方法是什么?
我一直在尝试使用scikit-learn库来解决这个问题。 大致: 从 sklearn.preprocessing 导入多项式特征 从 sklearn. Linear_model 导入 LinearRegression # 制作或...
我正在利用 Scikit-Learn 的随机森林库,我想知道是否可以更改特征权重,因此特定特征会产生更大的影响。我穿过随机森林
错误:所有估计器都应该实现拟合和变换,或者在使用 make_column_transformer 时可以是“drop”或“passthrough”说明符
我正在尝试实现一个使用 ColumnTransformer() 和 SVC() 的模型。 我的转换方法如下所示: num_features = X_train_svm.select_dtypes(include=np.number).columns.to_list()
如何传递 sklearns train_test_split 实际数据系列而不是单个值作为输入参数?
我想训练一个基于 LSTM 的 RNN 模型进行二元分类,为此我想使用带有 LSTM 层的张量流 keras 模型。为此,我需要测试输入和输出以及
我正在尝试根据训练数据使用逻辑回归对测试数据中的一系列点进行预测。 我得到了一个输出,没有错误,但是结果,我被告知......
我目前正在研究一个模型来预测一个人感染冠状病毒后的死亡概率。 我正在使用带有分类变量的荷兰数据集:感染日期、致命......
Sklearn StackingClassifier 非常慢且 CPU 使用率不一致
我最近一直在尝试 sklearn 的 StackingClassifier 和 StackingRegressor,但我注意到它总是很慢并且使用我的 cpu 效率低下。这么说吧(只是为了这个前任……
如何在 scikit-learn 中进行逻辑回归后检索 Hessian 矩阵?
我正在使用 scikit-learn 包在中等大的数据集(300k 行,2k 列。这对我来说相当大!)上计算逻辑回归。 现在,由于 scikit-learn 不产生conf...
导入错误:numpy.core.multiarray 无法使用最新的 numpy 版本导入
我尝试在 VSCode 中运行此代码并不断遇到此错误消息: '使用 NumPy 1.x 编译的模块无法在 NumPy 2.1.2,因为它可能会崩溃。同时支持 1.x 和 2.x
使用 sklearn 的 RandomForestRegressor 进行预测
这是我的数据的样子...... 日期、区域设置、类别、网站、alexa_rank、会话、user_logins 20170110,美国,1,谷歌,1,500,5000 20170110,欧盟,1,谷歌,2,400,2000 20170111,美国,2,facebook,2,400,2000 ... 一个...
使用sklearn LogisticRegression和RandomForest模型的Predict()总是预测少数类(1)
我正在构建一个 Logistic 回归模型,以使用仅包含 150 个观察值的数据集来预测交易是否有效 (1) 或无效 (0)。我的数据在两个类之间分布如下: 106
我想在分割 tran_test_split 来解决线性回归问题时执行分层方法。 我知道 stratify 可以解决分类问题,因为它会排除 2 个或更多类别 做什么
我正在尝试使用 pip 命令安装 sklearn 模块,但安装完成后,我只能看到这个文件夹 C:\Users\Aditi\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.
我想绘制一个混淆矩阵来可视化分类器的性能,但它仅显示标签的数量,而不显示标签本身: 从sklearn.metrics导入confusion_matrix 小鬼...
我注意到我可以在随机森林分类器中设置随机状态,但不能在补朴素贝叶斯中设置。我收到错误 类型错误:__init__() 得到意外的关键字参数“random_state” 我认为这是
如何使用 sklearn minmaxscaler 有条件缩放
我有一列有正值、0 值和负值。具有 0 值的行构成数据帧的 90%。我想缩放此列,但不触及 0 值行。仅那些没有...的行
我有一个神经网络,适用于我在教程中找到的一个数据集。过去 48 小时我一直在研究代码,它运行得很好。但现在,我想测试其他数据集,但失败了。它...