data-cleaning 相关问题

数据清理是删除或修复错误以及规范计算机程序中使用的数据的过程。例如,可以移除异常值,可以插入丢失的样本,可以将无效值标记为不可用,并且可以合并同义值。一种数据清理方法是Wickham的“整洁数据”框架,http://vita.had.co.nz/papers/tidy-data.pdf,这意味着每一行都是一个观察,每一列都是一个变量。

如何从一周开始日期获取周五日期

大家好。 我对 excel 还很陌生,我的日期是 2024 年 3 月 17 日。这个日期实际上是第 12 周的开始。从本周开始日期开始,我怎样才能获得该周的周五日期

回答 1 投票 0

从 csv 文件中删除几个空列的 R 函数是什么

所以我正在研究这个: csv 文件的屏幕截图 我正在尝试删除最后 4 列,我应该使用什么代码?我在 Rstudio 上打开它并运行 R。 我尝试做 Df$列 <- NUL...

回答 1 投票 0

忽略 Table.ExpandTableColumn 中的错误或自动替换为 null

我正在从文件夹加载 100 个 XML 文件,Power Query 已从我加载的第一个文件创建了一个函数。问题是并非所有 XML 文件都具有相似的结构。有些有节点...

回答 1 投票 0

在R中使用separate_wider_delim时填充列号

我在 R 中有一个数据集,其中包含一个列,该列包含一个字符串,我想使用 tidyr 包中的 split_wider_delim 将其分成多个列。 我想做的是垫...

回答 1 投票 0

使用 Excel Power Query 将 JSON 数组提取到同一行

我有以下 JSON { “数据”: { "总执行时间": "00:00:00.5544916", "总计数": "33414", “物品”...

回答 1 投票 0

枢轴更长,带有分隔前缀

我必须使这个数据帧 Increm_Moran 更长才能进行可视化。 我基本上有一个共同的列距离,然后是 16 个变量的 MoranIndex 和 zscore(社区、csrstrateg...

回答 1 投票 0

如何使用 apply 函数删除 z 分数(3 或 -3)的异常值

我正在研究UCI心脏病,并将所有可测量的值更改为z分数,我想将大于3或小于-3的值分别替换为3和3或...

回答 2 投票 0

使用 PowerQuery 确定组中的最大值

我有一张桌子: 行程编号 停止序列 Y1 1 Y1 2 Y1 3 Y1 4 Y1 5 Y2 1 Y2 2 Y2 3 Y2 4 我想为具有最高值

回答 1 投票 0

如何有效地抓取数据并清理它

我从网站上抓取了数据,但无法清理它 这是我用来抓取数据的代码,这是最佳实践吗? 导入请求 从 bs4 导入 BeautifulSoup 导入 json

回答 1 投票 0

如何从Excel中删除小波浪号和其他特殊字符?

我正在从头开始学习excel,我有一个大约7000个条目的数据集。其中一些条目包含诸如清洁数据之类的文本。这显然不是干净的数据,我想强调......

回答 1 投票 0

如何在 SQL 数据库中的任何列中查找特定字符?

我们最近发现我们的数据已被某些编辑器损坏(并且我们的后端没有在途中过滤它......是的,我们应该修复这个问题)。具体来说,我们发现了删除

回答 2 投票 0

检查 Excel 单元格中某个字符集中是否存在任何字符,并相应地返回值

我有一个数据集,其中有几个单元格应包含数字,但格式为文本。 我想做的是输入一个公式来检查是否存在以下任何一项...

回答 1 投票 0

如何在 Pandas 数据框中分割不带逗号且布局不规则的地址?

我在这样的数据框中有一列(它包含更多地址): 地址 287安多弗广场罗宾斯维尔新泽西州08691 1 牛津 Ct 普林斯顿 Jct NJ 08550 244 N 后路普林斯顿 Jct 新泽西州 08550 3

回答 1 投票 0

如何在 Power BI 中删除字符串中的引号?

我有带引号的非结构化数据,我想使用 Power Query 删除它们。这是一个例子: 有: chrome 现在已经“处理”了 8 分钟。 想: chrome 已处理 8 分钟...

回答 1 投票 0

如何更新 BigQuery 表中的时间戳值?

我需要更新一些存储不正确的日期值。我有两个要合并的数据表。基本上,表 1 和表 2 包含连续几个月的相同数据。表 1 有

回答 1 投票 0

如何在使用 ydata-profiling 后获得清理后的数据框?

我知道它可能不会被完美清理(因为它是一项自动化任务),但我想了解如何在原始数据被处理后获取清理后的数据帧(不是原始数据)...

回答 1 投票 0

用多列中的多个变量整理数据框

我正在使用“熔化”数据框,尽管也许“火山”是对它更合适的描述。 基本上,此数据框中有两列违反了第一条规则...

回答 1 投票 0

使用 Awk 从 Markdown 链接字符串中提取基本名称

这是一个字符串,我想从中提取文件名部分,但我无法做到。 所以请帮助我。 这是字符串,有很多很多类似的字符串,如下所示: ![我...

回答 1 投票 0

使用awk以先进和硬核的方法从尴尬的字符串中提取所需的字符串部分?

这是一个字符串,我想从中提取文件名部分,但我无法做到。 所以请帮助我。 这是字符串,有很多很多类似的字符串,如下所示: ![我...

回答 1 投票 0

合并列名称不同的列

我有一个 df 看起来有点像下面这样: Var1_E1_C1 <- c(1, NA, NA, 1, 1) Var1_E1_C2 <- c(NA, 3, 2, NA, NA) Var23_E2_C1 <- c(NA,2 , NA, 1, 1) Var23_E2_C2 <- c(3,NA , 1, NA, NA)

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.