imputation 相关问题

缺少数据插补是用替换的“最佳猜测”值替换缺失数据的过程。由于缺失数据可能会产生分析数据的问题并可能导致数据丢失,因此估算是一种避免与列表删除相关的问题的方法(忽略所有缺失值的观察结果)。

我在sklearn的IterativeImputer输出中得到负值。

我正在使用sklearn库中的Multiple Imputer来推算雨量数据集中的一些缺失值,其中包含雨量站和雨量数据(每个雨量站为一列,索引为DateTime)......

回答 1 投票 -1

阿梅利亚相关分析

我想从Amelia包中的原始数据集 "freetrade "中的推算数据集进行相关性分析。所以首先我加载了数据,并使用amelia函数创建了多个数据集:......

回答 1 投票 1

从多个数据帧中获取和保存结果

我有九个不同的数据帧 df1, df2, df3, df4, df5, df6, df7, df8和df9. 我想写一个函数,应用下面的计算,使用小鼠包的每个数据帧......。

回答 1 投票 0

如何在R中从数据帧的多重计算中创建表格?

我想应用模拟计算来评估RMSE。我有10个没有缺失值的数据帧df1, df2, df3, ..., dm10,每个数据帧都包含三个变量,例如df1$x, df1$y, df1$z。...

回答 1 投票 1

MICE pool()函数的输出可以用dplyr进行分组吗?

在使用MICE软件包对一些数据集进行多重归入后,我想为两个因变量(score_1, score_2)分别计算单独的线性回归模型。该 ...

回答 1 投票 1

sklearn计算满足条件的行。

我试图使用sklearn SimpleImputer来推算包含Titanic数据的pandas DataFrame中某一列的缺失年龄。然而,我想分别推算乘客的年龄值...

回答 1 投票 0

用最后的已知值填充时间序列列值

我有一个Pandas的时间序列数据框架是这样的:ID ... ...(一些列)1120 1220 1320 1420 1520 1620 ........ 1 10 20 0 40 0 50 2 ...

回答 1 投票 0

使用给定的特征集在python中输入时间序列数据。

那么我的数据是这样的:年份,y,x1,x2,x3,x4 2009,0.5,0.4,0.4,0.9 2013,nan,0.4,0.5,0.8 2020,0.8,0.39,0.51,0.7 数据是以年为单位的,但是每一年之间的时间间隔并不一致......。

回答 1 投票 0


在R中多次插入后计算预测均值(或预测概率)和SE

我想计算预测值和标准误差,但是我不能简单地使用预报(),因为我正在使用15个乘法估算数据集(生成的Amelia程序包)。我在每个...上运行回归模型...

回答 1 投票 3

在插入熊猫时忽略列名

我正在尝试使用KNNImputer软件包将缺少的值插入到我的数据框中。这是我的数据框pd.DataDrame(numeric_data)年龄bmi儿童收费0 19 NaN ...

回答 1 投票 0

我收到此错误:“应用Imputer时,传递的值的形状为(55,93315),索引表示为(68,93315)”

这是我的代码,来自sklearn.preprocessing import Imputer imp = Imputer(strategy ='median')imputed_df = pd.DataFrame(imp.fit_transform(df1),column = df1.columns)`错误...

回答 1 投票 0

我如何使循环跳过产生警告的输入?

我正在一系列数据集上运行复杂的函数(使用Amelia进行多次插补)。数据集经常会触发一长串警告,最终导致错误。我会...

回答 1 投票 1

Pyspark在列级别内向前和向后填充

我尝试在pyspark数据框中填充丢失的数据。 pyspark数据框如下所示:+ --------- + --------- + ------------------- +- -+ |纬度|经度| Timestamplast |名称| + --------- + -------......>

回答 1 投票 0

r保留最近的(id)并归入NAs

我有一个数据集,其中每一行代表一个学生的回答。每列代表一个教师评估问题。 StudentId Q1 Q2 Q3 Q4 SystemTime 1 NA 5 2 ...

回答 2 投票 0

处理缺少的分类值ML

我已经完成了替换分类数据中的缺失值的操作,这与处理分类数据中的缺失值有关。数据集约有6个类别列,缺少值。这将用于...

回答 1 投票 0

分割数据帧并将函数应用于R中的2个不同行

我正在尝试将mi.meld应用于144个数据帧的列表,以便将估算值及其标准误差组合在一起。由于Amelia无法使用列表,因此我将其取消嵌套到大数据框中,...

回答 2 投票 0

我如何将Stata的估算数据集导入R?

我需要对大型数据集(n = 60,000,50个变量)执行多次插补。我试图在R中使用MICE,但是遇到了内存问题。我转向Stata并能够使用链式方程来...

回答 1 投票 0

在R中复制Stata mi归因回归或分析来自Stata的归因数据集

我正在尝试复制使用多个插补的Stata分析(在R中)。 mi步骤采用以下形式:mi impute回归y x1,add(5)rseed(123)mi估计:reg y trt我从Stata文档中了解到...

回答 1 投票 0

使用函数及其内容的不同结果

我试图了解impyute库的fast_knn函数的工作原理。因此,我尝试逐行执行它以了解其工作原理。在这里是:从...

回答 2 投票 2

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.