data-manipulation 相关问题

数据操作是将数据从不太有用的状态更改为更有用的状态的过程。

使用separate_wider_regex为R中的每个匹配创建一个新行

我有一个带有长“评论”列的数据框,其中包含有关不同研究地点的多个区域中物种存在的半结构化信息。该模式通常是......

回答 1 投票 0

从列表中提取非空元素

我有一个这样的列表: x = 列表(a = 1:4,b = 3:10,c = NULL) x #$a #[1] 1 2 3 4 # #$b #[1] 3 4 5 6 7 8 9 10 # #$c #无效的 我想提取所有

回答 6 投票 0

如何在R中进行Group By Rollup? (如 SQL)

我有一个数据集,我想执行类似于 SQL 中聚合值的 Group By Rollup 之类的操作。 下面是一个可重现的示例。我知道聚合效果非常好,正如她所解释的......

回答 4 投票 0

如何根据数据源合并两行?

使用雪花: 我有一个查询,它从 5 个不同的数据源生成一个非常简单的表联合: 与个人信息工作日作为( 选择 “工作日”AS 来源, 演员表(w.

回答 1 投票 0

在 Pyspark 中计算重复次数

目前我正在处理一个大型数据框并面临一个问题。 我想返回每个值在表中重复的次数(计数)。 例如: 数字 10 重复了两次,所以我想要...

回答 1 投票 0

将宽数据重构为长数据

我正在尝试重新组织我的数据框以使分析更容易。 目前数据如下: 当前数据外观 我想以长格式重新组织,如下所示: 理想的数据外观 如果有的话...

回答 1 投票 0

在R中将一列分成多列

从第 2 行第 2 列开始,我需要将数值分成剩余的列 (2:7) 这是数据 结构(列表(州= c(“州”,“阿拉巴马州”,“唉......

回答 1 投票 0

仅限于 R 中具有特定年龄范围数据的人

我有以下长格式数据框,其中包含列、id、年龄和 BMI。我对数据集进行了限制,只允许在 2 周到 10 岁之间进行至少 3 次重复测量的人 (id)...

回答 1 投票 0

按组绘制置信区间

我正在寻求有关我的代码的帮助。 我有一个数据集,其中许多人被要求对 5 个不同的场景进行评分,范围为 -5 到 +5。 然后我按照我的要求将 2 组分为 S 和 A

回答 1 投票 0

如何从 pandas 中的相关性中删除重复项?

我的结果有一些问题: dataCorr = data.corr(method='pearson') dataCorr = dataCorr[abs(dataCorr) >= 0.7].stack().reset_index() dataCorr = dataCorr[dataCorr.level_0!=dataCorr.level_...

回答 3 投票 0

如何根据另一行的值复制 R 中的行?

我想知道如何编写一个函数来根据列中的值复制行,例如如果一行与下一行之间存在 > +-0.1 的差异,则复制该行,以便...

回答 1 投票 0

在 Polars Python API 中将两列组合成元组

我有一个极坐标数据框,如下所示: df = pl.DataFrame({"bid": [1, 2, 3], "fid": [4, 5, 6]}) 我想将两列按行组合成一个元组,以便...

回答 2 投票 0

在 MultiLabelBinarizer 中获取计数

如何获取 MultiLabelBinarizer 中的项目计数? 将 pandas 导入为 pd 从 sklearn.preprocessing 导入 MultiLabelBinarizer mlb = MultiLabelBinarizer() pd.DataFrame(mlb.fit_transform([(1,1,2)...

回答 2 投票 0

在传单中循环

我有下面的代码,我想按每个集群对overlayGroup进行for循环。 库(dplyr);图书馆(传单);库(光栅);库(htmltools) 簇 <- c("1st.C", "2nd.C&

回答 1 投票 0

递归地更改嵌套对象数组中的特定属性

我遇到了一个问题,试图更改嵌套对象数组中特定属性的值: 常量 myObj = [ { “描述”:“西澳州”, “数据”:[ { ...

回答 2 投票 0

一种连接数据透视表父行的子行数据的方法

我有一个包含以下数据的大型数据透视表。粗体文本是父行数据,后续年份(非粗体数据)是父行的子数据。是否可以在Excel或...

回答 1 投票 0

使用 for 循环有条件地更改 numpy 数组的元素

我有一个二维 numpy 数组,我想将所有“男性”值更改为 0,将所有“女性”值更改为 1。 如果我尝试将 arr2D[row,element] 分配给特定值, 我得到一个

回答 1 投票 0

将值转换为行号

我正在进行一些生存分析,并尝试将我的宽表转换为长格式以使用 dplyR 进行分析。我想将“死苍蝇”的值转换为具有二进制状态的行...

回答 1 投票 0

使用 dplyr 计算数据列中的“条纹”

我认为标题没有清楚地解释我需要做的数据计算,所以我在下面创建了一个简单的可重现示例: 这是输入数据框 结构(列表(homePoints = c(0,0,0,...

回答 2 投票 0

r Id 内每个观察值的差异

假设我有这样的数据集 id时间cd4序列 1 -0.741958 548 1 1 -0.246407 893 2 1 0.243669 657 3 2 -2.7296369 464 1 2 -2.2505131 845 2 2 -0.

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.