feature-selection 相关问题

在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。


python:如何从feature_importances获取真实的特征名称

我正在使用Python的sklearn随机森林(ensemble.RandomForestClassifier)进行分类,并使用feature_importances_来查找分类器的重要特征。现在我的代码是: 对于

回答 3 投票 0

如何停止Boruta算法在输出中包含结果变量?

我正在用 Rshiny 开发一个应用程序,它允许用户在上传的数据集上运行 Boruta 算法。 它在输出中包含结果变量。我知道不应该这样做,但是...

回答 1 投票 0

如何在Weka中应用特征缩减方法?

如何在 weka 中应用 LSI 等特征缩减方法进行文本分类? LSI等特征约简方法能否提高分类准确率?

回答 1 投票 0

你能帮我解决这个错误吗? AttributeError:'numpy.ndarray'对象没有属性'keys'

中 all_features = X_train.keys() AttributeError:'numpy.ndarray'对象没有属性'keys' 这是我的代码: cor_list = [] #计算每个特征与y的相关性 对于我来说

回答 1 投票 0

partykit:在 cforest 上使用 varimp 获取包含 NA 值的数据集时出错

我想估计变量在解释响应变量时的相对重要性(“dep_var”,基于 4 点李克特量表的数值变量)。我最感兴趣的是相关...

回答 1 投票 0

PySpark 中的特征选择

我正在研究形状为 1,456,354 X 53 的机器学习模型。我想为我的数据集进行特征选择。我知道如何使用以下代码在 python 中进行特征选择。 来自 skle...

回答 4 投票 0

使用 Bootstrap 重采样、LASSO 和逐步回归进行特征选择

在本文中,作者通过以下方式进行放射组学特征选择以进行生存预测: Bootstrap 对数据集重采样 x 1000 将交叉验证的 LASSO 模型拟合到每个重采样数据...

回答 2 投票 0

使用 r 中的 mRMRe 包进行生存数据中的特征选择

我正在寻找r中生存数据的一些特征选择方法。我想使用最大相关性和最小冗余来完成上述任务。在 mRMRe 包的小插图中,它提到了它们

回答 1 投票 0

使用单一特征训练模型同时使用观察权重是否正确?

使用单个特征(在本例中为距离)训练模型,同时还使用观察权重,是否正确? 我正在尝试训练一个机器学习模型,其中唯一的输入特征是......

回答 1 投票 0

所有中间步骤都应该是变压器并实现拟合和变换

我正在使用重要特征选择来实现管道,然后使用相同的特征来训练我的随机森林分类器。以下是我的代码。 m = ExtraTreesClassifier(n_estimators = ...

回答 3 投票 0

如何利用许多分类特征进行分类

我是机器学习新手,想了解更多有关分类的信息。我有一个包含 n=600 个评分样本和数千个潜在指标的小数据集,所有指标都是分类的(正确或错误)。基本上,我会...

回答 1 投票 0

使用 GaussianNB 选择KBest 的结果不精确/一致

我想使用 SelectKBest 选择前 K 个特征并运行 GaussianNB: 选择 = SelectKBest(mutual_info_classif, k=300) data_transformed = Selection.fit_transform(数据, 标签) 新数据传输...

回答 2 投票 0

多行观察的分类:长格式到宽格式总是有效?

我有一个观察表,或者更确切地说是“分组”观察,其中每个组代表一笔交易,每行代表一个产品。但预测是在交易层面进行的。下面是...

回答 1 投票 0

ValueError:list.remove(x):在进行模型构建时x不在列表中 - 特征选择的逐步选择

我正在使用 statsmodels.api 作为 sm 进行特征选择的逐步选择,在运行代码时出现此错误 ValueError: list.remove(x): x 不在列表中 对于下面的...

回答 1 投票 0

如何通过特征重要性进行特征选择循环,其中删除的特征在Python的每次迭代中imp = 0或低于平均imp?

我在Python Pandas中有DataFrame,如下所示: 输入数据: Y - 二元目标 X1...X5 - 预测变量 DataFrame的源代码: 将 pandas 导入为 pd 将 numpy 导入为 np 从 xgboost 导入 XGBClassifie...

回答 1 投票 0

我如何知道使用 SelectKBest 选择了哪些功能?

运行 SelectKBest 后会选择一些特征,结果以数组形式返回,所以我不知道它们是哪些特征,因为我的训练集有数千个特征。 我想要...

回答 2 投票 0

机器学习输入有数值列和数组列,处理机器学习中的混合类型数据

我正在开发一个机器学习项目,其中我有一个数据集,其中包含数字列和包含数组的列的组合。数字列(例如平均值)包含单个值,而

回答 1 投票 0

在 sklearn 管道中使用固定特征实现自定义套索回归以进行变量选择

R 语言中有两篇与此主题相关的帖子,包括 Lasso 回归模型中的固定回归量和固定效应 Lasso logit 模型 我正在使用 Lasso 编写一个特征选择模型

回答 1 投票 0

属性错误:“ParticleSwarmOptimization”对象没有属性“global_best_fitnes”

用于特征选择的执行代码 PSO 错误 定义健身(位置): selected_features = np.array(位置, dtype=bool) X_selected = X.iloc[:, selected_features] X_train,X_test,y_...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.