缺少数据插补是用替换的“最佳猜测”值替换缺失数据的过程。由于缺失数据可能会产生分析数据的问题并可能导致数据丢失,因此估算是一种避免与列表删除相关的问题的方法(忽略所有缺失值的观察结果)。
我在两个不同但相关的数据帧上使用 mouse 包。 虽然两个数据帧的绝大多数变量是相同的,但每个数据都有少数变量是唯一的......
数据框有5列,分别是ID、index_date、last_date、measure_date和measurement,每个ID只有一个index_date和last_date,但有多个measure_date: 设置.seed(0) 图书馆(
我正在使用 R 上的 mouse 包来估算问卷的缺失值,并且我想找到多向相关矩阵,以便我可以对其进行分析(例如 alpha、EFA)。 我不确定...
sklearn 的 KNN Imputer 可以处理数据框中的特定行吗?
我有一个包含一些 NaN 值的 pandas 数据框,我正在尝试使用 KNN 填充器来填充它们。我希望输入器根据特定参数选择“邻居”,在这种情况下它应该只
使用没有记录事件的小鼠进行多次插补后,数据包含缺失值(即,没有常数值或多重共线性的证据)
使用mice包进行多重插补(pmm方法)后,我的数据集中仍然存在缺失值(尽管缺失值的数量减少了)。 我检查过没有...
我目前正在使用两个数据框,并尝试使用小鼠插补进行线性模型分析。然而,当尝试使用函数 geeglm 进行分析时,似乎
使用 Hmisc 包将系列参数传递给 fit.mult.impute 以使用修改后的泊松进行多重插补时出现问题
我之前能够使用通过 Hmisc 包多重插补创建的数据来运行修改后的泊松回归。我一个月前运行代码没有问题,但现在遇到了问题
使用 Rstudio 中的 R 插值来估算一天中每个小时的个体级别缺失数据的最佳方法是什么?
我有一个数据面板,其中包含 3 年观察到的一年中 5 个月的数据。我们在这些时期观察到了许多人。问题是很多人都...
我正在构建一个具有内生和外生时间序列变量的 VARMAX 模型。数据集包含 1950-2019 年的所有时间序列变量,除了一个不是
我正在学习机器学习,我遇到了处理缺失数据的问题。它说如果数据有偏差,建议使用中值插补。我尝试绘制我的数据,这就是结果......
多重插补后(当结果和中介都是二元的时)如何对因果中介分析做敏感性分析?
我希望使用中介包 (https://cran.r-project.org/web/packages/mediation/mediation.pdf) 对已经估算的数据进行一些敏感性分析。好像没有
我在我的数据中估算了一些 NA,计算了一个回归模型,并希望在 HTML 表格中显示结果。我知道如何为常规模型执行此操作。 图书馆(观星者) mydf<- ir...
如何在 miceadds 中使用 ml.lmer 方法估算数据
我正在尝试应用 ml.lmer 将缺失数据归因于以下数据框 dt =结构(列表(f = c(“3”,“3”,“3”,“3”,“3”,“3”,&
我有以下数据: # 图书馆 将熊猫导入为 pd 将 numpy 导入为 np 从 sklearn.impute 导入 KNNImputer 从 sklearn.preprocessing 导入 OneHotEncoder,OrdinalEncoder 来自 sklearn.metr ...
data.frame( group = c("a", "b", "c", "d", "e", "总计"), 计数 = c(NA, NA, 10, 21, 49, 85) ) > 组数 1个不适用 2 ...
R 中的 mice 包/函数抛出一个我不明白的 lm.fit 错误
我正在尝试使用 mice 包来估算大型数据集。有 14 个变量有缺失值,我需要 mice() 函数来估算,但是当我尝试使用该函数时,它保持
我想展示我的结果中的 PCA 和 LDA 图,基于根据一个分类变量分布的 140 个个体。在这个个体中,我测量了 50 个变量(基因表达)。对于...
我真的不知道如何通过按组计算其周围环境的平均值来填充NA。换句话说,我不希望其他组中的数据计算在周围的平均值中。 我有一个...
如何使用 CLEVELS 语句为 SAS 9.4 中的 surveyimpute 函数指定我的类级别?
我正在使用以下代码: ***疑难解答***; PROC surveyimpute DATA=data_Impute METHOD=FEFI varmethod=jackknife;类人 HH (CLEVELS=(1 2 3 4 5 6 7)); VAR人HH;地层 sdmvstra;集群