scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

如何使用 Sklearn 获取文本格式的词袋和词频?

我想使用 Sklearn 的 CountVectorizer 打印出语料库中每个文档的单词列表(即词袋)及其各自的术语频率(以文本格式)。我怎么会痛...

回答 1 投票 0

PNG 转换为 Scikit learn 数字格式

我需要一些帮助才能将 PNG RGBA 转换为 Scikit learn 中数字识别的正确格式。这是我的代码 图像 = Image.open(图像路径) 打印(图像.尺寸) 打印(图像.模式) ...

回答 1 投票 0

Keras 类权重和 KeyError 问题

我预计我已经看到了这个问题:Keras class_weight error字典键/值指的是同一问题,但解决方案似乎对我没有帮助。 有了这段代码,我只是在其中做广告...

回答 1 投票 0

用于增量学习的Python非线性回归器

我想知道scikit-learn是否有一个非线性回归例程,它允许增量学习,即通过partial_fit调用。我看到 SGDRegressor 和 PassiveAggressiveRegre...

回答 1 投票 0

如何应用PCA和随机森林训练的模型来测试数据?

在解决一个机器学习问题时,我对训练数据实施 PCA,然后使用 sklearn 对训练数据应用 .transform。观察差异后,我只保留那些

回答 1 投票 0

将数据拆分为训练和测试

有谁知道如何在一个数据集上进行训练并在另一个数据集上进行测试? 到目前为止,我只知道我们可以使用这行代码将一个数据集拆分为训练和测试: X_train,X_test,y_train,

回答 2 投票 0

将二次多项式拟合到 p 维数据并计算其梯度和 Hessian 矩阵的最佳方法是什么?

我一直在尝试使用scikit-learn库来解决这个问题。 大致: 从 sklearn.preprocessing 导入多项式特征 从 sklearn. Linear_model 导入 LinearRegression # 制作或...

回答 2 投票 0

网格搜索为带有 LOGO 或 LOO 的 best_score 提供 nan,而不是 k 折 CV

我在网格搜索方面遇到了 nan R2 分数问题。 FDODB=pd.read_excel('LOGO.xlsx 最终训练集') 数组 = FDODB.值 X = 数组[:,2:126] Y = 数组[:,1] 复合=数组[:,0] 定标器=标准S...

回答 1 投票 0

如何解决错误“Axes”对象没有属性“is_first_col”?

从sklearn.model_selection导入train_test_split,cross_val_score,StratifiedKFold 从 matplotlib 导入 pyplot 从 sklearn.preprocessing 导入 StandardScaler 将 pandas 导入为 pd 导入matp...

回答 1 投票 0

在Python中,将二次多项式拟合到p维数据并计算其梯度和Hessian矩阵的最佳方法是什么?

我一直在尝试使用scikit-learn库来解决这个问题。 大致: 从 sklearn.preprocessing 导入多项式特征 从 sklearn. Linear_model 导入 LinearRegression # 制作或...

回答 1 投票 0

如何调整随机森林模型中的特征权重?

我正在利用 Scikit-Learn 的随机森林库,我想知道是否可以更改特征权重,因此特定特征会产生更大的影响。我穿过随机森林

回答 3 投票 0

错误:所有估计器都应该实现拟合和变换,或者在使用 make_column_transformer 时可以是“drop”或“passthrough”说明符

我正在尝试实现一个使用 ColumnTransformer() 和 SVC() 的模型。 我的转换方法如下所示: num_features = X_train_svm.select_dtypes(include=np.number).columns.to_list()

回答 1 投票 0

如何传递 sklearns train_test_split 实际数据系列而不是单个值作为输入参数?

我想训练一个基于 LSTM 的 RNN 模型进行二元分类,为此我想使用带有 LSTM 层的张量流 keras 模型。为此,我需要测试输入和输出以及

回答 1 投票 0

逻辑回归未返回正确结果

我正在尝试根据训练数据使用逻辑回归对测试数据中的一系列点进行预测。 我得到了一个输出,没有错误,但是结果,我被告知......

回答 1 投票 0

具有概率目标的决策树

我目前正在研究一个模型来预测一个人感染冠状病毒后的死亡概率。 我正在使用带有分类变量的荷兰数据集:感染日期、致命......

回答 3 投票 0

Sklearn StackingClassifier 非常慢且 CPU 使用率不一致

我最近一直在尝试 sklearn 的 StackingClassifier 和 StackingRegressor,但我注意到它总是很慢并且使用我的 cpu 效率低下。这么说吧(只是为了这个前任……

回答 2 投票 0

如何在 scikit-learn 中进行逻辑回归后检索 Hessian 矩阵?

我正在使用 scikit-learn 包在中等大的数据集(300k 行,2k 列。这对我来说相当大!)上计算逻辑回归。 现在,由于 scikit-learn 不产生conf...

回答 1 投票 0

导入错误:numpy.core.multiarray 无法使用最新的 numpy 版本导入

我尝试在 VSCode 中运行此代码并不断遇到此错误消息: '使用 NumPy 1.x 编译的模块无法在 NumPy 2.1.2,因为它可能会崩溃。同时支持 1.x 和 2.x

回答 1 投票 0

使用 sklearn 的 RandomForestRegressor 进行预测

这是我的数据的样子...... 日期、区域设置、类别、网站、alexa_rank、会话、user_logins 20170110,美国,1,谷歌,1,500,5000 20170110,欧盟,1,谷歌,2,400,2000 20170111,美国,2,facebook,2,400,2000 ... 一个...

回答 1 投票 0

使用sklearn LogisticRegression和RandomForest模型的Predict()总是预测少数类(1)

我正在构建一个 Logistic 回归模型,以使用仅包含 150 个观察值的数据集来预测交易是否有效 (1) 或无效 (0)。我的数据在两个类之间分布如下: 106

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.