scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

在sklearn中创建TfidfTransformer时,“use_idf”到底做了什么?

我正在使用Python 2.7中sklearn包中的TfidfTransformer。 当我逐渐适应这些论点时,我对 use_idf 变得有点困惑,如下所示: TfidfVectorizer(use_idf=Fa...

回答 3 投票 0

ValueError:无法将字符串转换为浮点数:'?'与 MSE 合作时

我正在使用 auto-mpg 数据集。我给出了下面数据集的链接: https://www.kaggle.com/datasets/uciml/autompg-dataset 我给出下面的代码: df = pd.read_csv('数据/auto-mpg.csv') ...

回答 1 投票 0

如何在管道中将参数传递给sklearn Cox模型?

如果我运行以下Python代码,它运行良好: 目标=“流失” tranOH = ColumnTransformer([ ('one', OneHotEncoder(drop='first', dtype='int'), make_column_selector(dtype_include='类别', 帕特...

回答 1 投票 0

使用显式阈值进行从峰值到谷值增加/减少的 Python 机制标记

我试图找到时间序列中最长的时间段,其中从开始到结束的值至少增加一定的阈值,而中间没有任何下降至少该值

回答 1 投票 0

Pandas - 自动检测日期列**在运行时**

我想知道 pandas 是否能够自动检测哪些列是日期时间对象并将这些列读取为日期而不是字符串? 我正在查看 api 和相关堆栈

回答 3 投票 0

Jupyter Notebook 导入错误:没有名为“sklearn”的模块

我正在尝试在本地计算机上运行。 我收到一个错误 ImportError:仅在 jupyter 笔记本中没有名为“sklearn”的模块 当我从命令行使用 python 和 carnd-te 时,它工作得很好...

回答 7 投票 0

高斯过程二元分类:为什么 GPy 的方差比 scikit-learn 小得多?

我正在学习高斯过程的二元分类,并且我正在将 GPy 与 scikit-learn 在受 Martin Krasser 博客文章启发的玩具一维问题上进行比较。两种实现(GPy 和 s...

回答 1 投票 0

如何使用 scikit 线性回归查找系数的特征名称?

我使用scikit线性回归,如果我改变特征的顺序,coef仍然以相同的顺序打印,因此我想知道特征与coeff的映射。 #训练...

回答 10 投票 0

Pandas DataFrame - KNNImputer 算法实现

我有一个包含缺失值的数据集,我想按组填充它们。我使用了 groupby() 方法,效果很好。但我想使用 KNNImputer 算法做同样的事情。 代码我有...

回答 1 投票 0

具有不同基础学习器的 AdaBoostClassifier

我正在尝试将 AdaBoostClassifier 与除 DecisionTree 之外的基础学习器一起使用。我尝试过 SVM 和 KNeighborsClassifier 但出现错误。可以与

回答 4 投票 0

为什么在高斯过程回归器中添加更多数据点后均值预测变得平坦

我正在尝试在机器人模拟器中进行贝叶斯优化,以找到适合所需轨迹(正弦运动)的最佳 Kd 和 Kp 值。首先,我使用 ...

回答 1 投票 0

多类 SVM 中的类几乎所有数据点都作为支持向量(scikit-learn)正常吗?

我使用 scikit-learn 的 SVC 对鸢尾花数据集进行多类分类,一类几乎将所有数据点作为支持向量。这是预期的吗?还是我的

回答 1 投票 0

保留 TFIDF 结果以预测新内容

我正在Python上使用sklearn来做一些聚类。我已经训练了 200,000 个数据,下面的代码运行良好。 语料库 = open("token_from_xml.txt") 矢量化器 = CountVectorizer(decode_error="

回答 5 投票 0

如何将日期时间列更改为适合机器学习的格式

我有太多日期时间列,我需要将其更改为机器学习合适的格式? 2003-01-09 2022-10-12 23:03:34 向量或其他东西 0.0145132 0.548542 有什么建议吗? 我需要使用...

回答 1 投票 0

如何使用 Sklearn 获取文本格式的词袋和词频?

我想使用 Sklearn 的 CountVectorizer 打印出语料库中每个文档的单词列表(即词袋)及其各自的术语频率(以文本格式)。我怎么会痛...

回答 1 投票 0

PNG 转换为 Scikit learn 数字格式

我需要一些帮助才能将 PNG RGBA 转换为 Scikit learn 中数字识别的正确格式。这是我的代码 图像 = Image.open(图像路径) 打印(图像.尺寸) 打印(图像.模式) ...

回答 1 投票 0

Keras 类权重和 KeyError 问题

我预计我已经看到了这个问题:Keras class_weight error字典键/值指的是同一问题,但解决方案似乎对我没有帮助。 有了这段代码,我只是在其中做广告...

回答 1 投票 0

用于增量学习的Python非线性回归器

我想知道scikit-learn是否有一个非线性回归例程,它允许增量学习,即通过partial_fit调用。我看到 SGDRegressor 和 PassiveAggressiveRegre...

回答 1 投票 0

如何应用PCA和随机森林训练的模型来测试数据?

在解决一个机器学习问题时,我对训练数据实施 PCA,然后使用 sklearn 对训练数据应用 .transform。观察差异后,我只保留那些

回答 1 投票 0

将数据拆分为训练和测试

有谁知道如何在一个数据集上进行训练并在另一个数据集上进行测试? 到目前为止,我只知道我们可以使用这行代码将一个数据集拆分为训练和测试: X_train,X_test,y_train,

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.