missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

如何删除数据集顶部和底部的零行

考虑以下示例数据框 df=data.frame(x=c(0,3,5,0,7,6,0),y=c(0,0,3,0,0,4,0),z=c(8, 7,6,8,9,4,3)) 我想删除第一行和最后一行,其中 y=0,即第 1,2 行和第 7 行 - 没有

回答 1 投票 0

在第一个和最后一个有效索引之间单独切片 pandas 列

假设我有一个包含 P 列的数据框 df ,其中不同行可能会丢失数据,例如第一行数据可用于第 1 列但可用于第 2 列,对于其他行可能反之亦然。我是...

回答 1 投票 0

识别并巩固重复的观察结果

我正在研究临床试验的数据。在此数据中,存在涉及同一患者的多个观察结果,并且它们具有不同程度的缺失数据。我有四个变量......

回答 2 投票 0

在 R 中的几列中按组(年和月)计数 NA 值

我想计算该系列中每个月和年的缺失值 (NA) 数量,并绘制几列的条形图。 如何从数据框中提取这些信息? <- read.

回答 1 投票 0

按组(年份和日期)计算 R 中多个列中的 NA 值

我想计算该系列中每个月和年的缺失值 (NA) 数量,并绘制几列的条形图。 如何从数据框中提取这些信息? <- read.

回答 1 投票 0

在 VS Code 中导入库时出现问题

我尝试在本地 VS 代码中运行一些脚本,但我不断收到此错误“无法解析导入“pyjson5””。这个也出现在所有其他库中,

回答 1 投票 0

使用库 mouse() 中的估算数据集来拟合 R 中的多级模型

我是在 R 中打包小鼠的新手。但我试图从 popmis 中估算 5 个数据集,然后用每个数据集拟合一个 lmer() 模型,最后用 pool() 拟合它们。 我认为 mouse() 中的 pool() 函数不会...

回答 2 投票 0

如何在 gnuplot 中制作缺失数据的连续线

我有一些数据缺少条目,这些条目被替换为?,这是一个片段: 20 0.8793 2.14765 1.57448 0.808 1.08829 0.86717 21 0.88832 2.23218 1.57538 0.92825 1.20609 22 1.8370...

回答 1 投票 0

用另一个数据集中的数据替换 NA 值

我有这个数据集,这是一个例子: df1 州年 ColA ColB ColC 俄亥俄州 2000 200 190 180 俄亥俄州 2002 218 200 176 俄亥俄州 2010 218 205 185 肯塔基州 2000 2...

回答 1 投票 0

线程“主”java.lang.UnsatisfiedLinkError中出现异常:无法加载库:/usr/lib/jvm/java-17-openjdk-amd64/lib/libawt_xawt.so

只想加载 .jar 文件,但我不能,当运行 java --version 时,我得到: openjdk 17.0.4 2022-07-19, OpenJDK 运行时环境(内部版本 17.0.4+8-Debian-1),以及 OpenJDK 64 位服务器虚拟机(构建...

回答 2 投票 0

SQL 脚本返回重复行

我有一个脚本,我需要从不同的表返回很多值,但是在排列某些表时我不断收到重复的行,并且我也无法链接其他表。 我想要重新...

回答 1 投票 0

Weka 工具中列的平均值

如何应用列的平均值来删除数据集中的缺失值。 我想使用“列平均值”替换数据集中的缺失值,它将用

回答 1 投票 0

用 NN 进行插值,数据中留下 NaN

我尝试使用最近邻从数据集中输入值,它对几乎所有 NaN 都做到了这一点,但它错过了两个。 我正在研究泰坦尼克号数据集,我正在尝试估算 m 的年龄......

回答 1 投票 0

使用 SQL 创建日期列,组合年月日列,其中少数年月日为 NULL

我有年、月、日三列。不幸的是,很少有年、月或日为 NULL。如何创建一个日期列,组合这三列,其中年、月和日不是......

回答 1 投票 0

使用同一行中的先前值填充 R 矩阵中的缺失值

考虑以下示例 之前 = 矩阵(c(1, 2, 3, NA, 4, 5, NA, NA, 1), ncol = 3) 之后 = 矩阵(c(1, 2, 3, 1, 4, 5, 1, 4, 1), ncol = 3) 之前的矩阵是我经常处理的矩阵

回答 2 投票 0

Power BI DAX:根据行值对不同列求和

我有两个表:A 和 B。A 有一列 [cat]。 B 有 3 列:[cat]、[amount] 和 [fringe]。 A[cat] 有 3 个值:“Fringe”、“Salary”和“Other”。 B[猫]只有h...

回答 1 投票 0

将 NA 值随机分配给数据框中的列

我正在尝试将 NA 值分配给一列。 数据: df <- data.frame(V1 = c(0, 0, 0, 1, 0, 1, 1, 1, 1, 0), V2 = c(0, 0, 0, 1, 1, 1, 1, 1, 1, 0), V3 = c(0, 1, 1, 0, 0, 0, 1, 1...

回答 1 投票 0

如何填写 Polars 数据框中缺失的日期(python)?

我似乎没有找到 Polars 库的等效项。但基本上,我想要做的是填充大数据框的两个日期之间缺失的日期。由于尺寸的原因,它必须是 Polars

回答 2 投票 0

是否有一个简化的 SQL 查询来返回表中缺失值的数量和百分比? (BigQuery)

BigQuery 地震公共数据集有 47 列,其中大部分都有缺失值。我需要一个输出,显示包含 column_name、total_entries、non_missing_entries 和 Percentage_miss 的摘要...

回答 1 投票 0

制作缺少年份的动画

我正在尝试使用 gganimate 随着时间的推移对位置进行动画处理,并拥有一个从 2004 年到 2022 年运行的数据集。不幸的是,我没有 2020 年的数据(由于新冠疫情)。当我尝试使用 gganimate 时,2020 年显示...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.