scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。
我想使用 Sklearn 的 CountVectorizer 打印出语料库中每个文档的单词列表(即词袋)及其各自的术语频率(以文本格式)。我怎么会痛...
我需要一些帮助才能将 PNG RGBA 转换为 Scikit learn 中数字识别的正确格式。这是我的代码 图像 = Image.open(图像路径) 打印(图像.尺寸) 打印(图像.模式) ...
我预计我已经看到了这个问题:Keras class_weight error字典键/值指的是同一问题,但解决方案似乎对我没有帮助。 有了这段代码,我只是在其中做广告...
我想知道scikit-learn是否有一个非线性回归例程,它允许增量学习,即通过partial_fit调用。我看到 SGDRegressor 和 PassiveAggressiveRegre...
在解决一个机器学习问题时,我对训练数据实施 PCA,然后使用 sklearn 对训练数据应用 .transform。观察差异后,我只保留那些
有谁知道如何在一个数据集上进行训练并在另一个数据集上进行测试? 到目前为止,我只知道我们可以使用这行代码将一个数据集拆分为训练和测试: X_train,X_test,y_train,
将二次多项式拟合到 p 维数据并计算其梯度和 Hessian 矩阵的最佳方法是什么?
我一直在尝试使用scikit-learn库来解决这个问题。 大致: 从 sklearn.preprocessing 导入多项式特征 从 sklearn. Linear_model 导入 LinearRegression # 制作或...
网格搜索为带有 LOGO 或 LOO 的 best_score 提供 nan,而不是 k 折 CV
我在网格搜索方面遇到了 nan R2 分数问题。 FDODB=pd.read_excel('LOGO.xlsx 最终训练集') 数组 = FDODB.值 X = 数组[:,2:126] Y = 数组[:,1] 复合=数组[:,0] 定标器=标准S...
如何解决错误“Axes”对象没有属性“is_first_col”?
从sklearn.model_selection导入train_test_split,cross_val_score,StratifiedKFold 从 matplotlib 导入 pyplot 从 sklearn.preprocessing 导入 StandardScaler 将 pandas 导入为 pd 导入matp...
在Python中,将二次多项式拟合到p维数据并计算其梯度和Hessian矩阵的最佳方法是什么?
我一直在尝试使用scikit-learn库来解决这个问题。 大致: 从 sklearn.preprocessing 导入多项式特征 从 sklearn. Linear_model 导入 LinearRegression # 制作或...
我正在利用 Scikit-Learn 的随机森林库,我想知道是否可以更改特征权重,因此特定特征会产生更大的影响。我穿过随机森林
错误:所有估计器都应该实现拟合和变换,或者在使用 make_column_transformer 时可以是“drop”或“passthrough”说明符
我正在尝试实现一个使用 ColumnTransformer() 和 SVC() 的模型。 我的转换方法如下所示: num_features = X_train_svm.select_dtypes(include=np.number).columns.to_list()
如何传递 sklearns train_test_split 实际数据系列而不是单个值作为输入参数?
我想训练一个基于 LSTM 的 RNN 模型进行二元分类,为此我想使用带有 LSTM 层的张量流 keras 模型。为此,我需要测试输入和输出以及
我正在尝试根据训练数据使用逻辑回归对测试数据中的一系列点进行预测。 我得到了一个输出,没有错误,但是结果,我被告知......
我目前正在研究一个模型来预测一个人感染冠状病毒后的死亡概率。 我正在使用带有分类变量的荷兰数据集:感染日期、致命......
Sklearn StackingClassifier 非常慢且 CPU 使用率不一致
我最近一直在尝试 sklearn 的 StackingClassifier 和 StackingRegressor,但我注意到它总是很慢并且使用我的 cpu 效率低下。这么说吧(只是为了这个前任……
如何在 scikit-learn 中进行逻辑回归后检索 Hessian 矩阵?
我正在使用 scikit-learn 包在中等大的数据集(300k 行,2k 列。这对我来说相当大!)上计算逻辑回归。 现在,由于 scikit-learn 不产生conf...
导入错误:numpy.core.multiarray 无法使用最新的 numpy 版本导入
我尝试在 VSCode 中运行此代码并不断遇到此错误消息: '使用 NumPy 1.x 编译的模块无法在 NumPy 2.1.2,因为它可能会崩溃。同时支持 1.x 和 2.x
使用 sklearn 的 RandomForestRegressor 进行预测
这是我的数据的样子...... 日期、区域设置、类别、网站、alexa_rank、会话、user_logins 20170110,美国,1,谷歌,1,500,5000 20170110,欧盟,1,谷歌,2,400,2000 20170111,美国,2,facebook,2,400,2000 ... 一个...
使用sklearn LogisticRegression和RandomForest模型的Predict()总是预测少数类(1)
我正在构建一个 Logistic 回归模型,以使用仅包含 150 个观察值的数据集来预测交易是否有效 (1) 或无效 (0)。我的数据在两个类之间分布如下: 106