imputation 相关问题

缺少数据插补是用替换的“最佳猜测”值替换缺失数据的过程。由于缺失数据可能会产生分析数据的问题并可能导致数据丢失,因此估算是一种避免与列表删除相关的问题的方法(忽略所有缺失值的观察结果)。

SQL,仅对第一个空值进行向后填充,仅对最后一个空值进行前向填充,对其他空值进行线性插值

如何在bigquery中对具有列时间戳的表中的列进行向后、向前和线性插值填充? 我有这张表: 时间戳 霉菌 1 无效的 2 无效的 3 69 4 无效的 5 71 6 72...

回答 1 投票 0

KNN 与 scikit-learn:如何使用 NaN 欧几里得度量获得距离矩阵?

我在缺少值的数据集上使用 sklearn.impute.KNNImputer。我想尝试几个邻居。 要实例化 KNNImputer,应指定邻居的数量。迪...

回答 1 投票 0

按每组的平均值填充缺失值

这应该很简单,但我发现的最接近的是这篇文章: pandas:填充组内的缺失值,但我仍然无法解决我的问题...... 假设我有以下数据...

回答 12 投票 0

如何对pandas中的每组进行前向填充

我有一个类似于下面的数据框 编号 A B C D E 1 2 3 4 5 5 1 南 4 南 6 7 2 3 4 5 6 6 2 南 南 5 4 1 我想对 fo 中的 A、B、C 列进行空值插补...

回答 1 投票 0

R - 将估算的缺失值放回到数据框中

我正在使用 aregImpute 来估算 R 数据帧 (bn_df) 上的缺失值。 代码是这样的: 库(Hmisc) impute_arg <- aregImpute(~ TI_Perc + AS_Perc + CD_Perc + CA_P...

回答 2 投票 0

如何将 R 中嵌套的两组字符串中具有唯一值的行组合起来

这有点令人费解;我有一个数据框,其中有进行门诊就诊的患者,每次就诊都有药物,每列一种药物。在某些场合,有

回答 1 投票 0

无法让crr() Fine-Gray模型在R中使用mice()处理估算数据(Cov1/model.matrix-problem?)

在使用估算数据(中型数据,使用 mouse-packge 估算)进行精细灰色 Crr() 分析时遇到了重大问题。问题似乎是 Cov1 命令,因为我无法让它从...

回答 2 投票 0

如何使用GridSearchCV比较imputer方法?

我正在对泰坦尼克号数据集进行预处理,以便通过一些回归来运行它。 在这种情况下,训练集和测试集中的“年龄”列仅填充大约...

回答 1 投票 0

预测矩阵和“小鼠”中的自定义插补的插补失败

我根据其他三列 Y1、Y2、Y3 估算三列 X1、X2、X3。我更喜欢自定义插补,而不是来自小鼠的 pmm,因为我需要保留以下规则: X1和X2总是...

回答 1 投票 0

使用 pool.scalar() 进行多变量分析,在多重插补后汇集数据

我的研究旨在检查预测变量和结果变量之间的多个平行中介变量。我使用小鼠对缺失数据进行多重插补。我想使用 PROCESS fu...

回答 1 投票 0

具有分类/因子变量的多级多重插补 (MICE)?

我有一个数据集,我试图在多级设置中对 mouse、miceadds 和 mousemd 包使用多重插补作为分类/因子变量。我可以使用方法2l.2...

回答 1 投票 0

如何使用 MICE 来插补以 R 数据集中其他值为条件的缺失值

我有一个由 2 个连续变量 X1、X2 组成的数据集,两者都有缺失值,我需要估算缺失的数据。我正在使用 R 中的 MICE 包。问题是 val...

回答 1 投票 0


将列中的 NA 替换为日期列中最接近的 NA,将非 NA 替换为 R 中的条件

我有一个类似于下面的数据框 - 我的实际数据更大且分组 - 并且想知道如何将 NA 与最接近的非 NA 插补为整数变量,就日期而言,即......

回答 1 投票 0

Pandas:用训练集中每组的平均值替换测试集中的缺失值

我想根据“Class”列每个类别的平均值来替换测试集“X”列中的缺失值,但这些平均值必须来自

回答 1 投票 0

用因子水平替换一系列变量中的NA

这是我的数据,我想将 NA 替换为“否”。我可以一一替换缺失值。但是,我需要替换代码中 s_1:s_4 中的 NA。提醒一下,所有变量...

回答 2 投票 0

我可以仅对用 R 中的 MICE 估算的数据集的子样本进行汇总回归分析吗?

我使用 R 中的“mice”包进行了多重插补。之后,我使用“with”和“pool”函数计算了汇总回归分析。 为了进一步分析,我只想看看...

回答 1 投票 0

在R中,如何估算右删失缺失数据以遵循假设的分布?

早些时候,堆栈溢出中已经解释了左删失数据遵循假设分布的随机插补。使用 censlm 包可以轻松实现。 但如果我...

回答 1 投票 0

vim 包中的 knn 插补算法返回错误结果

根据我的理解,R VIM 包中的 knn 算法采用缺失点周围的 k 个点,然后使用平均值、中位数等方法聚合它们。如果是这种情况,为什么......

回答 1 投票 0

小鼠/小鼠添加的描述性数据

我使用了 mouse/miceadds 来进行多重插补。我有兴趣获得“汇集数据集”的一些描述性统计数据 问题: 1) 我想知道上面的值的百分比...

回答 4 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.