缺少数据插补是用替换的“最佳猜测”值替换缺失数据的过程。由于缺失数据可能会产生分析数据的问题并可能导致数据丢失,因此估算是一种避免与列表删除相关的问题的方法(忽略所有缺失值的观察结果)。
[我正在尝试使用R中的mouses软件包估算连续变量的平均值。我能够生成m个估算的平均值,但是当我尝试使用pool()函数汇总这些平均值时,会得到一个...
我有一个缺少值的数据框,其中可能的选项为True或False,因为在有NaN种情况下,pandas将列作为浮点,并在推算该列和...之后]]
LabelEncoder在估算缺少的值后无法进行逆变换(看不见的标签)
我处于初级到中级数据科学水平。我想使用knn从数据框中估算缺少的值。由于数据框包含字符串和浮点数,因此我需要使用...
说我有一个像这样的数据框:以pd格式导入大熊猫,以np格式导入numpy,np.random.seed(0)df = {} df ['x'] = np.concatenate([np.random.uniform(0, 5,4),np.random.uniform(5,10,4)])df ['y'] = np ....
遍历DataFrame列名列表,仅将其名称为整数或浮点数的列名添加到新列表中
这里是数据帧的快照:这是我尝试运行的代码:第一个列表包含所有具有空/ NaN值的条目的列名cols_missing_values = [col ...
我正在尝试使用knn估算缺少的值,但我无法使用代码:从fancyimpute import KNN是否有其他库可以用于knn估算?
我使用missMDA包来填充多个分类列。但是,我无法从这两个函数获得任何结果:estim_ncpMCA(test_fill)和imputeMCA(test_fill)。程序继续运行...
我想增加AIS或GPS数据的密度,以便随后进行更精确的分析。在研究期间,我遇到了不同的方法,例如插值,滤波...
我有一个包含10多个分类变量和大约20个数字变量的数据集。我正在尝试编辑Stef van Buuren在github上可用的mice.impute.logreg函数,以调用glm.fit(),但是...
WT列的丢失数据被编码为-99。我想用WT的上一个和下一个值的平均值替换丢失的值。例如,缺少的值是在时间= 2和时间= 3时我想要...
我有一些纵向数据,需要根据一些规则来估算缺失的值:如果一个人的第一个跟进数据缺失,则添加下一行的值;如果是某人的非首次随访...
我正在尝试进行初学者机器学习项目Big Mart Sales。该项目的数据集包含许多类型的缺失值(NaN)和需要更改的值(lf-> Low Fat,reg ...
我正在使用一个包含有关多个用户的每月信息的数据集。每个用户都有不同的时间范围。每个用户也缺少数据。我想做的就是填写...
我有一个类别变量var1,它可以采用W,B,A,M,N或P的值。我想使用R中的mouses包来推算一些NA,但我知道缺少值不能为“ ...
我正在使用mouses包来估算数据,并且我已经阅读了有关限制估算值的后处理的信息。我要使用10个不同级别(a,...
我的工作与用微小的约20%缺失数据的时间序列(在不同的长度)。 AFAIK贝叶斯方法可处理优雅丢失的数据,我想尝试,以适应贝叶斯时间序列模型...
我有以下问题:我有一个熊猫数据帧,其中丢失的值由串标呐。我想在其上运行的Imputer与列均值替换缺失值。 ...
我有一个大的熊猫数据成名DF。它有相当多的missings。删除行/或COL-明智的是不是一种选择。归咎于中位数,手段或最频繁的值不是一个选项是(因此...