scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。
我在预处理后使用训练测试分割来分割数据。 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...
yellowbrick 实现错误 - AttributeError:“LogisticRegression”对象没有属性“fig”
我是 Yellowbrick 的新用户。在 Yellowbrick ClassificationReport 中实现 sklearn LogisticRegression API 时,我发现了一些不寻常的错误。我已经按照
我有 4 个不同的数据集,每个数据集包含属于两个类之一的二维样本:1 或 2。每个样本的类标签(1 或 2)位于最后一列...
在 scikit-learn 中使用 NSL-KDD 数据集进行超参数优化以提高分类精度
我正在使用 NSL-KDD 数据集,我的任务是使用 scikit-learn 提高分类算法的准确性。具体来说,我有兴趣获得更多的准确度分数...
我正在使用 DBSCAN 等聚类算法。 它返回一个名为 -1 的“簇”,这些点不属于任何簇。对于这些点,我想确定从它到新点的距离...
我在理解 Surprise 工作流程时遇到了一些困难。我有一个用于训练的文件(我试图将其分为训练和验证)和一个用于测试数据的文件。我很难理解...
建议/参考链接/代码表示赞赏。 我有一个超过 1500 行的数据。每行都有一个句子。我正在尝试找出找到最相似句子的最佳方法...
我正在使用一个数据集,其中每个样本都包含数字和文本数据。因此,采用多种方法从数据集中构建训练特征矩阵。对于
尝试拟合机器学习模型时出现错误 AttributeError: 'bool' 对象没有属性 'transpose'
我正在尝试创建一个机器学习模型来预测谁会在泰坦尼克号上幸存。每次我尝试拟合我的模型时,都会收到此错误: 坐标 = np.where(mask.transpose())[::-1]
使用 scikit learn 进行快速 ICA - 重建误差分析
我正在尝试在 scikitLearn 中使用 fastICA 程序。出于验证目的,我尝试了解基于 PCA 和 ICA 的信号重建之间的区别。 观察到的原始数量
是否有更好的内置方法可以在单个管道中进行网格搜索和测试多个模型?当然模型的参数会有所不同,这让我很难弄清楚......
我有一个依赖 scikit-learn、pandas、numpy 和 sqlachemy 的 python 无服务器项目。 这些包的总大小约为 350MB,比允许的层大小多 100MB。有没有什么...
我想预测当X(天)代表时间时变量Y(c_start)的下一个值。 正如您在图片中看到的,我有属性“c_start”的值,我想...
我有不同国家和因素的时间序列数据,例如从 1972 年到 2007 年“阿富汗”的出生率(来源)。 目标: 预测例如2008年和2012年的出生率 ...
我正在尝试使用 scikit-learn 的 SVM 模型来设置一个用于预测时间序列的 python 代码。 我的数据包含过去 24 小时内每隔 30 分钟间隔的 X 值,我需要预测...
使用GridSearchCV进行Logistic回归时的精度计算警告
我正在尝试使用 LogisticRegression 估计器运行 GridSearchCV 并记录模型准确性、精度、召回率、f1 指标。 但是,我在精度指标上遇到以下错误: 精确...
我有一个 OneVsOne 模型,在文本特征和目标字段上运行良好。为了发展到多类模型(即具有多个文本特征字段),我相信 OneVsRest 与 Logistic Regres...
使用 pandas 和 sklearn 转换器时如何保留数据类型?
在使用大型 sklearn Pipeline(适合使用 DataFrame)时,我遇到了一个错误,该错误导致我的输入数据类型错误。问题发生在来自...的一次观察中
将 sklearn 的 BaggingClassifier 与 GridSearchCV 一起使用时出现 ZeroDivisionError
我正在尝试通过装袋改进完美运行的伯努利朴素贝叶斯模型。 但是当我尝试交叉验证 BaggingClassifier 时,我得到了一个非常意外的 ZeroDivisionError 来自 par...
在kaggle中处理“泰坦尼克号”数据集时发现输入变量样本数量不一致
我进行了玩具 Kaggle“泰坦尼克号”数据集训练,并按照名为“应用机器学习:算法”的 linkedin 视频课程的说明进行操作 当我输入以下代码时...