df 相关问题


使用 R 中的 ggraph 包排列和着色圆圈

我有一个数据框df: df 输出(df) 结构(列表(组= c(“根”,“根”,“NS2A”,“NS2A”,“NS2A”, “NS5”、“NS5”、“NS5&...


将 lambda 函数转换为常规函数 PYTHON df["domain_count"] = df.apply(lambda row : df['domain'].value_counts()[row['domain']], axis = 1)

我有当前的 lambda 函数: df["domain_count"] = df.apply(lambda row : df['domain'].value_counts()[row['domain']], axis = 1) 但我想将其转换为常规函数,例如 t...


如何在 dplyr::filter 中使用变量?

我有一个与数据框中的列同名的变量: df <- data.frame(a=c(1,2,3), b=c(4,5,6)) b <- 5 I want to get the rows where df$b == b, but dplyr interprets this as df$b ==...


在 R 中使用 gsub 替换字符串 + [重复]

这是我的 df: df <- data.frame(a = as.character(c("AB+CD+EF", "GH+IJ+KL")), x = c(1,2) ) df a x 1 AB+CD+EF 1 2 GH+IJ+KL 2 When I replace the string "+" by &


Rust Polars:如何显示所有列?

我使用 Rust Polars,发现使用它有点困难,因为不太确定如何显示所有列。 使用极坐标::df; // 使用宏 让 df = df! [ “A栏12345678910”...


动态 AND 计算分组依据

说,我有以下内容 # 虚拟数据 df <- data.table(metric_1 = c(1,1,3) , metric_2 = c(1,2,2) ); df metric_1 metric_2 1: 1 1 2: 1 ...


根据单一条件改变几列

df <- data.frame(x=1:10) Can I mutate several columns based on a single condition? For example, I can do this: df %>% 变异(y = if_else(x>3,"Y","N"), z = if_else(x>...


在另一个列表中计算一个列表中的元素

df 是这样的: df <- data.frame( groups=I(list(c("a"), c("b","c", "d", "e","f"), c("g","h"), c("i&quo...


使用 Z - Score 方法删除 pandas 数据框中具有异常值的行

我正在使用此代码来删除异常值。 将 pandas 导入为 pd 将 numpy 导入为 np 从 scipy 导入统计数据 df = pd.DataFrame(np.random.randn(100, 3)) df[np.abs(stats.zscore(df[0])) < 1.5] This wo...


新的总计列未显示在 df.info() 中

我使用添加了总计列 df['总计'] = df[列表(df.columns)].sum(axis=1) 我的数据框是 H1 H2 H3 合计 1.643910e+10 5.403600e+09 1.090...


为什么predict.lm给出的向量的长度与我解析的数据集不同?

我已经像这样在训练和测试之间分离了一个数据集。通过选择第 80% 的行索引并将其拆分。 # 消除所有变量 df <- df[,!(colnames(df) %in% c("sqm_lot&...


Python 新的总计列未显示在 df.info() 中

我使用添加了总计列 df['总计'] = df[列表(df.columns)].sum(axis=1) 我的数据框是 H1 H2 H3 合计 1.643910e+10 5.403600e+09 1.090...


导出的jupyter笔记本有不同的语法高亮

当我在 Jupyter 笔记本中有此 Python 代码时: df = pd.read_csv("data.csv",index_col=0) 打印(df.形状) read_csv 和 shape 为蓝色,“data.csv”为红色,0 ...


dplyr:用最后一列的数据进行变异

我想使用数据框最后一列的数据创建一个新列: df <- matrix(1:4, ncol = 2) %>% as.data.frame() df %>% 变异(V3 = .[[ncol(.)]] * 2) 有没有更容易重...


获取每个组值的列表列表,而无需在 pandas 中旋转表格

我有以下数据框: 将 numpy 导入为 np 将 pandas 导入为 pd 数据 = np.random.uniform(0, 1, (4, 5)) df = pd.DataFrame(数据, 列 = [2010,2011,2012,2013,2014]) df = df.stack().reset_ind...


如何在 pandas 中的特定列索引处插入列?

我可以在 pandas 的特定列索引处插入列吗? 将 pandas 导入为 pd df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]}) df['n'] = 0 这会将第 n 列作为...的最后一列


对数据框中的大量组合执行 Kruskal-wallis 测试

我在 R 中有一个 df,有 50 种 A 和 B 的独特组合。 对于 A 和 B 的每种组合,我想执行 Kruskal-wallis 测试: kruskal.test(D,C,data = df) 我想测试哪些组合 A 和...


如果 A 的子字符串位于一个 DF 的 B 字符串中,则不选择行

我有一个带有“员工通用名称”和“显示名称”的 df,如果“员工通用名称”位于“显示名称”内,我不想选择该行。 我有...


根据df2中两列间隔的值填充df1中的pandas列

我正在尝试填写包含离散样本深度(样本df)的数据框中的空列。我想扫描包含深度间隔的第二个数据帧(间隔 df)并检查 wh...


使用 R 对数据框中的大量组合执行 Kruskal-wallis 测试

我在 R 中有一个 df,有 50 种 A 和 B 的独特组合。 对于 A 和 B 的每种组合,我想执行 Kruskal-wallis 测试: kruskal.test(D,C,data = df) 我想测试哪些组合 A a...


使用grepl过滤特定范围列中的列名

我有一个 df 包含这样的 colnames: [1]“lab_id”“周”“组” [4]“级别”“id_row”...


ttkcalendar 在 python pandas df 中用于 Oracle 查询中的日期范围

先生 我成功地将所有 Oracle 11gr2 数据获取到 DF,但现在我想使用 tkinter 日历 date1 和 ttkcalendar 的 date1 根据用户给定的日期范围获取数据。 这两个怎么用


如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示: >> df.列 输出: MultiIndex([('月份', nan), (“TG”,...


如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示: >> df.列 输出: MultiIndex([('月份', nan), (“TG”,...


R 中的 gglikert 与分组因素

我在 R 中有一个数据框,如下所示: df # 小标题:150 × 7 分组 q1 q2 q3 q4 q5 ...


Pandas 数据框使用特定列的 interpolate() 分区

我有以下 Pandas 数据框(称为 df)。 +--------+--------+------+--------+ |人 |动物 |年份|数量 | +--------+--------+------+--------+ |约翰 |狗 | 2000 | 2000 2 | |...


各组之间的差异

我有一个像这样的数据框: df = 数据.frame( 重复 = c(1,1,1,2,2,2), 组 = c("a", "b", "c", "a", "b", "c"), 分辨率 = c(10,8,9...


在极坐标数据框中切片多个块

考虑以下数据框: df = pl.DataFrame(data={"col1": range(10)}) ┌──────┐ │ 第 1 列 │ │ --- │ │ i64 │ ╞══════╡ │ 0 │ │ 1 │ │ 2 │ │ 3 │ │ 4 │ │ 5 │ │ 6 │ ...


创建数字范围作为数据框的列

我的数据框是: 将 pandas 导入为 pd df = pd.DataFrame( { 'a': [20, 100], 'b': [2, 3], 'dir': ['长', '短'] } ) 预期输出:创建列...


在 Python 中合并 DataFrame 列

我有一个特殊的数据框,称为 df 这是它的样子 RepID +Col01 +Col02 +Col03 -Col01 +Col04 +Col05 -Col03 -Col04 +Col06 -Col07 1 5 7 9 8 3 8...


按顺序分配正值和负值的位置

假设我有以下数据框: df = 小标题( 季度 = c(seq.Date(as.Date("2022-03-01"), as.Date("2023-12-01"), "季度")), 值 = c(rnorm(3)...


如何在具有初始值的 mutate 中使用滞后/超前?

样本df: 图书馆(tidyverse) 鸢尾花 <- iris[1:10,] iris$testlag <- NA iris[[1,"testlag"]] <- 5 Sepal.Length Sepal.Width Petal.Length Petal.Width Species testlag 1 5.1 ...


与类型平均值的偏差

我有一个像这样的 df: 结构(列表(日期 = 结构(c(18605, 18604, 18598, 18597, 18590、18584、18583、18578、18570、18569、18563、18562、18557、 18549、18548、18542、18541、18536、18534、18529、


删除 r 中数据帧内的所有小于符号

我有一个包含小于符号的数据框: 第 1 列 <- c(1,5,"<4",3,2,9) col2 <- c(1,7,"<3",1,0,"<9") df <- data.frame(col1,col2) I try to rem...


如何从Python中的matplotlib饼图获取颜色映射?

来自 pandas 关于从数据框创建饼图的文档: 我有以下代码: df = pd.DataFrame({'质量': [0.330, 4.87 , 5.97], ‘半径’: [2439.7, 6051.8, 6378.1]}...


如何调用Python类中的函数

我有一个Python类,其中有嵌套函数。我无法调用嵌套的函数。 类数据: __实例__ = 无 def writeCleanData(df,路径,d_path,行,天数,lk): ...


pandas 重新索引多重索引无法正常工作

我有一个 pandas(版本 1.0.5)DataFrame,具有两个级别的 MultiIndex,例如喜欢: mi = pd.MultiIndex.from_product((('a', 'c'), (5, 12))) np.随机.种子(123) df = pd.DataFrame(data=np.random.ran...


将包含日期的列按月拆分为多列。 SQL

我正在尝试根据月份验证登录的用户。 SQL 当前df 用户 ID 日期 P1302 2023-11-01 P1302 2023-10-01 P1302 2023-09-01 P1302 ...


如何从前面的其他列中减去特定列的平均值?

我想从数据集中前 3 列的每个值中减去每个“空白”列的平均值,如下所示: df <- data.frame(da=1:5...


Python Pandas ~ != 和 == 之间布尔索引的差异

我对在 != 之后使用 ~ 与仅使用 == 时使用布尔索引的不同结果感到困惑 我有一个有 4 列的 pandas df: 迪克 = { “一”:[1,1,1,0,0,1,1], “b&...


查找其中一列发生移动的两列之间的最大值

我的数据框是: 将 pandas 导入为 pd df = pd.DataFrame( { “一”:[20,9,31,40], 'b': [1, 10, 17, 30], } ) 预期输出:创建列 c ABC 0 20 1 20 1 9...


DT::DTOutput 仅在第一行放置样式

我有一个数据框df。我想知道是否可以仅在第一行添加样式,我想突出显示计算缺失值的行,并且我希望在


模块“pandas”没有属性“read_csv

将 pandas 导入为 pd df = pd.read_csv('FBI-CRIME11.csv') 打印(df.head()) 运行这个简单的代码会出现错误: 回溯(最近一次调用最后一次): 文件“C:/Users/Dita/Desktop/python/les...


前一天数据填写N/A

我有一个数据框,它只有工作日的数据。以下是示例数据框: 将 pandas 导入为 pd df = pd.DataFrame({'BAS_DT': ['2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05', '2023-01-05 ...


在 R 中查找多列中的字符串

我有多个列,其中包含相似的数据,并且我有多个单词,我想知道它们是否在其中一列中。 举个例子 : df = data.frame(ttt1= c("METO",&q...


Pyspark - 按列表循环数据帧列

pyspark 新手。只是尝试简单地循环变量列表中存在的列。这是我尝试过的,但不起作用。 列列表 = ['colA','colB','colC'] 对于 df 中的 col: 如果 col 在


JUNIT 测试用例-Spark JDBC

我是 Java 编程的新手。我有一个从Oracle数据库读取数据的方法。现在我需要帮助使用 JUnit 框架为以下代码编写测试用例。 数据集 df = Spark.read().


合并索引上的两个数据帧,去掉 key_0

我想通过索引列合并两个数据帧。我的代码是: 将 pandas 导入为 pd 将 numpy 导入为 np df1 = pd.DataFrame({'a': ['红色', '红色', '红色']}) df2 = pd.DataFrame({'b': [1, 2, 2]}) df = ...


Polars:在 select/with_column 调用中添加一些列的总和

我想添加一列,它是所有列的总和,但一些带有极坐标的 id 列。这可以使用 Polars.DataFrame.sum(axis=1) 来完成: 将极坐标导入为 pl df = pl.DataFrame( { &


将 R 中 3 个变量的总和重新调整为恰好等于 1

我有一个如下数据框,其中有 3 列,每列代表在单个活动中花费的时间比例。 df <- data.frame(ID = c(1, 2, 3, 4), (time_1 = c(0.25...


© www.soinside.com 2019 - 2024. All rights reserved.