缺少数据插补是用替换的“最佳猜测”值替换缺失数据的过程。由于缺失数据可能会产生分析数据的问题并可能导致数据丢失,因此估算是一种避免与列表删除相关的问题的方法(忽略所有缺失值的观察结果)。
问题我有一些NaN的,我想从另一个数据框中填写关闭智能基础值的数据帧。我还没有找到一个有效的方式来做到这一点,但我怀疑有一种方法...
我的代码停止了小鼠(多由方程链式方程)包更新到版本> 3后工作。我想从线性回归检索估计方差 - 协方差矩阵...
由于无响应和其他随机因素,我正在分析一个数据集超过450k行,在我正在查看的一列(pa1min_)中有大约100k行(pa1min_)具有NA值。本专栏涉及......
每组为每个开始时间分配属于R中最高ID的最新结束时间和传输模式
我有一个数据操作问题,我可以单独解决插补问题,但不能同时解决这两个问题。我有一个按ID分组的曲目数据集(不同的人),每个曲目都有......
我有一个大的数值数据集(约700行,350,000列,作为R中的data.table读入)包含一些NA,我想尽快用列表示替换。我找到了......
'R','老鼠',缺少变量插补 - 如何只在稀疏矩阵中做一列
我有一个半稀疏的矩阵。所有细胞中有一半是空白的(na)所以当我尝试运行“老鼠”时,它会尝试对所有细胞进行处理。我只对一个子集感兴趣。问题:以下......
我想用每个行中的val2替换NA值,其中val的平均值对应于该ID列。任何简单(tidyverse)方式这样做?另外,我想知道如何用均值替换它(na.rm = TRUE)......
我有以下样本数据:ID GLUC TGL HDL LDL HRT MAMM SMOKE A 88 NA 32 99 Y NA从不B NA 150 60 NA NA从不C 110 NA NA 120 N NA NA D NA 200 65 165 ......
将.gprobs文件从Impute2转换为PLINK格式时出错
我有一组.gprobs文件,我需要导入Plink。但是,我一直得到同样的错误 - 特定行中的问题,即使我删除了该行及其周围的行。 ......
我使用了一个包含55个变量的171个观测值的数据集,其中包含35个具有NA的变量,我想用鼠标函数来估算:imp_Data
我有一个包含多个列的数据集,其中一列缺少所需的数据块。缺少数据的列df $ Variable始终归因于特定人员df $ Name。有没有 ...
862 2006-05-19 6.241603 5.774208 863 2006-05-20 NA NA 864 2006-05-21 NA NA 865 2006-05-22 6.383929 5.906426 866 2006-05-23 6.782068 6.268758 867 2006-05-24 6 ... 。
我写了一个KNN插补实现,我希望StratifiedKFold检查K和什么距离矩阵使用。我收到一个错误:它似乎无法将我的估算器识别为回归量(...
我有一个分类变量有三个级别(A,B和C)。我还有一个连续变量,上面有一些缺失值。我想用其组的平均值替换NA值。 ...
我很难弄清楚如何处理数据插补没有意义的NaN变量。我正在尝试进行文本/文档聚类,并且需要一些缺少值...
在python中使用sklearn自己的估算器进行网格搜索CV
我正在尝试构建自己的估算器(回归量)并将其用于估算(KnnImputation)。我在使用网格搜索“GridSearchCV”时遇到问题。有什么想法是什么问题?我的代码:班级......
我有一个数据集,包括基于这些测量的测量变量和分类变量。即,X1是测量变量,Y1将基于X1中的测量值为0或1。 ...
我正在学习如何处理数据集中的缺失值。我有一张约100万条表的桌子。我正在尝试处理少量的缺失值。我的数据涉及自行车共享系统......
我有一些数据看起来像...年份模型修剪2007年讴歌TL基地2010道奇复仇者SXT 2009道奇Caliber SXT 2008道奇Caliber SXT 2008道奇......