scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

在管道之前或之后分离 X 和 y 中的数据?

我有以下内容: train_set, test_set = train_test_split(arbres_df, test_size=0.2, random_state=42) 这是我们知道的旧的train_test_split。 然后我将特征和目标分开:

回答 1 投票 0

为什么 GARCH-SVM 对条件波动率输出相同的预测?

我正在使用 SVR-GARCH 模型来预测条件波动性,如 Abdullah Karasa 所著的《Machine Learning for Financial Risk Management with Python: Algorithms for Modeling Risk》一书中所述...

回答 1 投票 0

当我导入库时,为什么我的代码给出错误“sklearn not Define”?

我的代码 // 将 numpy 导入为 np 将 pandas 导入为 pd 将 matplotlib.pyplot 导入为 pyplot 导入pickle作为pk 从sklearn导入线性模型 从 sklearn.utils 导入洗牌 从 matplotlib 导入 st...

回答 1 投票 0

numpy.linalg.lstsq 和 sklearn.linear_model.LinearRegression 之间的区别

据我了解,numpy.linalg.lstsq 和 sklearn.linear_model.LinearRegression 都寻找线性系统 Ax = y 的解 x,从而最小化残差和 ||Ax - y||。 但他们不给...

回答 1 投票 0

Python 的一般线性多项式模型(用于输出误差模型)

我需要用python创建一个一般线性多项式模型。由于此类模型的定义各不相同,我需要指出的是,我引用了 NI 的此参考文献。我猜Matlab的实现是

回答 1 投票 0

在 TfidfVectorizer 标记化后删除二元组

我正在尝试删除 TfidfVectorizer 创建的二元组。 我正在使用 text.TfidfVectorizer,以便我可以使用自己的预处理器函数。 测试字符串和预处理器函数: 文档2 = ...

回答 1 投票 0

ROC 曲线*没有*模型估计器?

我创建了一个人工智能工具,它可以从图像中提取内容,然后检查该内容的完整性和准确性。我正在尝试评估这个工具的性能并且正在收集满足...

回答 1 投票 0

ValueError:类的数量必须大于一(python)

在 fit 中传递 x,y 时,出现以下错误: 回溯(最近一次调用最后一次): 文件“C:/Classify/classifier.py”,第 95 行,位于 train_avg, test_avg, cms = train_model(X, y, "c...

回答 3 投票 0

如何获得更高的余弦相似度分数

我已经使用nltk清理了我的数据,并且我的数据非常干净,我仍然无法获得更高的相似度分数,我正在制作一个食谱推荐系统,它获取成分并返回一个食谱...

回答 1 投票 0

sklearn 逻辑回归给出有偏差的结果?

我正在运行大约 1000 个类似的逻辑回归,具有相同的协变量,但数据和响应变量略有不同。我所有的响应变量都有稀疏的成功 (p(success) ...

回答 1 投票 0

值错误:y 包含以前未见过的标签:[8 9]

我有一个数据集,在输入模型之前我使用 label_encoding 进行数据预处理。 我首先对所有数据进行标签编码,然后将数据分为训练和测试。 我想用&

回答 1 投票 0

影响机器学习年度数据的多月模型

我正在寻找一种机器学习模型的建议,该模型可以解决我即将概述的问题。我最熟悉的两个模型是线性回归和Logistic

回答 1 投票 0

BIC(贝叶斯信息准则)应该更低还是更高

我对 BIC 图与 GMM 中组件数量的关系非常困惑。 Python 文档说越低越好,但我在一些网站上读到,正确的簇数是第一个

回答 1 投票 0

基于特征和连续变量值预测类别的分类器 ML 算法

我正在尝试编写一个分类器,我可以训练它来查看问题实例,并根据其特征和特定变量的值来预测问题属于哪一类。我不是

回答 1 投票 0

在 Python 3.10 中加载 sklearn DecisionTreeClassifier pickle 时出现 ValueError

由于旧版本已弃用,我在从 Python 3.7.3 转换到 Python 3.10 时遇到了问题。尝试加载腌制的 sklearn 时会出现问题

回答 1 投票 0

使用 GridSearchCV 进行目标缩放

对于超参数调整,我使用Python包sklearn中的函数GridSearchCV。我测试的一些模型需要特征缩放(例如支持向量回归 - SVR)。最近,...

回答 2 投票 0

Python3 skglm - “Poisson”对象没有属性“get_lipschitz”

我正在处理计数数据,想要用 L1 范数拟合泊松回归。我有以下代码,该代码会引发错误并且可重现: 将 numpy 导入为 np 导入SKLM 导入sklearn ...

回答 1 投票 0

如何将训练数据集中的记录链接到相应的模型预测?

使用 scikit-learn,我建立了一个回归模型来预测客户每笔交易的最大支出。我正在使用的数据集看起来有点像这样;目标栏是每笔交易的最大支出

回答 2 投票 0

CNN keras 中图像的混淆矩阵

我已经使用 keras 训练了我的 CNN 模型(多类分类),现在我想在我的测试图像集上评估该模型。 除了...之外,评估我的模型的可能选项还有哪些?

回答 4 投票 0

Pandas-Profiling 与 scikit-learn 冲突

当我尝试在我的 jupyter 笔记本中安装 pandas 分析时,我遇到错误: 错误:pip 的依赖解析器当前未考虑所有 已安装的软件包...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.