df 相关问题

我有一个数据框df： df 输出(df) 结构（列表（组= c（“根”，“根”，“NS2A”，“NS2A”，“NS2A”， “NS5”、“NS5”、“NS5&...

将 lambda 函数转换为常规函数 PYTHON df["domain_count"] = df.apply(lambda row : df['domain'].value_counts()[row['domain']], axis = 1)

我有当前的 lambda 函数： df["domain_count"] = df.apply(lambda row : df['domain'].value_counts()[row['domain']], axis = 1) 但我想将其转换为常规函数，例如 t...

如何在 dplyr::filter 中使用变量？

我有一个与数据框中的列同名的变量： df <- data.frame(a=c(1,2,3), b=c(4,5,6)) b <- 5 I want to get the rows where df$b == b, but dplyr interprets this as df$b ==...

在 R 中使用 gsub 替换字符串 + [重复]

这是我的 df： df <- data.frame(a = as.character(c("AB+CD+EF", "GH+IJ+KL")), x = c(1,2) ) df a x 1 AB+CD+EF 1 2 GH+IJ+KL 2 When I replace the string "+" by &

Rust Polars：如何显示所有列？

我使用 Rust Polars，发现使用它有点困难，因为不太确定如何显示所有列。使用极坐标::df； // 使用宏让 df = df! [ “A栏12345678910”...

动态 AND 计算分组依据

说，我有以下内容 # 虚拟数据 df <- data.table(metric_1 = c(1,1,3) , metric_2 = c(1,2,2) ); df metric_1 metric_2 1: 1 1 2: 1 ...

根据单一条件改变几列

df <- data.frame(x=1:10) Can I mutate several columns based on a single condition? For example, I can do this: df %>% 变异(y = if_else(x>3,"Y","N"), z = if_else(x>...

在另一个列表中计算一个列表中的元素

df 是这样的： df <- data.frame( groups=I(list(c("a"), c("b","c", "d", "e","f"), c("g","h"), c("i&quo...

使用 Z - Score 方法删除 pandas 数据框中具有异常值的行

我正在使用此代码来删除异常值。将 pandas 导入为 pd 将 numpy 导入为 np 从 scipy 导入统计数据 df = pd.DataFrame(np.random.randn(100, 3)) df[np.abs(stats.zscore(df[0])) < 1.5] This wo...

新的总计列未显示在 df.info() 中

我使用添加了总计列 df['总计'] = df[列表(df.columns)].sum(axis=1) 我的数据框是 H1 H2 H3 合计 1.643910e+10 5.403600e+09 1.090...

为什么predict.lm给出的向量的长度与我解析的数据集不同？

我已经像这样在训练和测试之间分离了一个数据集。通过选择第 80% 的行索引并将其拆分。 # 消除所有变量 df <- df[,!(colnames(df) %in% c("sqm_lot&...

Python 新的总计列未显示在 df.info() 中

我使用添加了总计列 df['总计'] = df[列表(df.columns)].sum(axis=1) 我的数据框是 H1 H2 H3 合计 1.643910e+10 5.403600e+09 1.090...

导出的jupyter笔记本有不同的语法高亮

当我在 Jupyter 笔记本中有此 Python 代码时： df = pd.read_csv("data.csv",index_col=0) 打印（df.形状） read_csv 和 shape 为蓝色，“data.csv”为红色，0 ...

dplyr：用最后一列的数据进行变异

我想使用数据框最后一列的数据创建一个新列： df <- matrix(1:4, ncol = 2) %>% as.data.frame() df %>% 变异(V3 = .[[ncol(.)]] * 2) 有没有更容易重...

获取每个组值的列表列表，而无需在 pandas 中旋转表格

我有以下数据框：将 numpy 导入为 np 将 pandas 导入为 pd 数据 = np.random.uniform(0, 1, (4, 5)) df = pd.DataFrame(数据, 列 = [2010,2011,2012,2013,2014]) df = df.stack().reset_ind...

如何在 pandas 中的特定列索引处插入列？

我可以在 pandas 的特定列索引处插入列吗？将 pandas 导入为 pd df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]}) df['n'] = 0 这会将第 n 列作为...的最后一列

对数据框中的大量组合执行 Kruskal-wallis 测试

我在 R 中有一个 df，有 50 种 A 和 B 的独特组合。对于 A 和 B 的每种组合，我想执行 Kruskal-wallis 测试： kruskal.test(D,C,data = df) 我想测试哪些组合 A 和...

如果 A 的子字符串位于一个 DF 的 B 字符串中，则不选择行

我有一个带有“员工通用名称”和“显示名称”的 df，如果“员工通用名称”位于“显示名称”内，我不想选择该行。我有...

根据df2中两列间隔的值填充df1中的pandas列

我正在尝试填写包含离散样本深度（样本df）的数据框中的空列。我想扫描包含深度间隔的第二个数据帧（间隔 df）并检查 wh...

使用 R 对数据框中的大量组合执行 Kruskal-wallis 测试

我在 R 中有一个 df，有 50 种 A 和 B 的独特组合。对于 A 和 B 的每种组合，我想执行 Kruskal-wallis 测试： kruskal.test(D,C,data = df) 我想测试哪些组合 A a...

使用grepl过滤特定范围列中的列名

我有一个 df 包含这样的 colnames： [1]“lab_id”“周”“组” [4]“级别”“id_row”...

ttkcalendar 在 python pandas df 中用于 Oracle 查询中的日期范围

先生我成功地将所有 Oracle 11gr2 数据获取到 DF，但现在我想使用 tkinter 日历 date1 和 ttkcalendar 的 date1 根据用户给定的日期范围获取数据。这两个怎么用

如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示： >> df.列输出： MultiIndex([('月份', nan), （“TG”，...

如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示： >> df.列输出： MultiIndex([('月份', nan), （“TG”，...

R 中的 gglikert 与分组因素

我在 R 中有一个数据框，如下所示： df # 小标题：150 × 7 分组 q1 q2 q3 q4 q5 ...

Pandas 数据框使用特定列的 interpolate() 分区

我有以下 Pandas 数据框（称为 df）。 +--------+--------+------+--------+ |人 |动物 |年份|数量 | +--------+--------+------+--------+ |约翰 |狗 | 2000 | 2000 2 | |...

各组之间的差异

我有一个像这样的数据框： df = 数据.frame( 重复 = c(1,1,1,2,2,2), 组 = c("a", "b", "c", "a", "b", "c"), 分辨率 = c(10,8,9...

在极坐标数据框中切片多个块

考虑以下数据框： df = pl.DataFrame(data={"col1": range(10)}) ┌──────┐ │ 第 1 列 │ │ --- │ │ i64 │ ╞══════╡ │ 0 │ │ 1 │ │ 2 │ │ 3 │ │ 4 │ │ 5 │ │ 6 │ ...

创建数字范围作为数据框的列

我的数据框是：将 pandas 导入为 pd df = pd.DataFrame( { 'a': [20, 100], 'b': [2, 3], 'dir': ['长', '短'] } ）预期输出：创建列...

在 Python 中合并 DataFrame 列

我有一个特殊的数据框，称为 df 这是它的样子 RepID +Col01 +Col02 +Col03 -Col01 +Col04 +Col05 -Col03 -Col04 +Col06 -Col07 1 5 7 9 8 3 8...

按顺序分配正值和负值的位置

假设我有以下数据框： df = 小标题（季度 = c(seq.Date(as.Date("2022-03-01"), as.Date("2023-12-01"), "季度")), 值 = c(rnorm(3)...

如何在具有初始值的 mutate 中使用滞后/超前？

样本df：图书馆（tidyverse）鸢尾花 <- iris[1:10,] iris$testlag <- NA iris[[1,"testlag"]] <- 5 Sepal.Length Sepal.Width Petal.Length Petal.Width Species testlag 1 5.1 ...

与类型平均值的偏差

我有一个像这样的 df：结构（列表（日期 = 结构（c（18605, 18604, 18598, 18597, 18590、18584、18583、18578、18570、18569、18563、18562、18557、 18549、18548、18542、18541、18536、18534、18529、

删除 r 中数据帧内的所有小于符号

我有一个包含小于符号的数据框：第 1 列 <- c(1,5,"<4",3,2,9) col2 <- c(1,7,"<3",1,0,"<9") df <- data.frame(col1,col2) I try to rem...

如何从Python中的matplotlib饼图获取颜色映射？

来自 pandas 关于从数据框创建饼图的文档：我有以下代码： df = pd.DataFrame({'质量': [0.330, 4.87 , 5.97], ‘半径’: [2439.7, 6051.8, 6378.1]}...

如何调用Python类中的函数

我有一个Python类，其中有嵌套函数。我无法调用嵌套的函数。类数据： __实例__ = 无 def writeCleanData(df,路径,d_path,行,天数,lk): ...

pandas 重新索引多重索引无法正常工作

我有一个 pandas（版本 1.0.5）DataFrame，具有两个级别的 MultiIndex，例如喜欢： mi = pd.MultiIndex.from_product((('a', 'c'), (5, 12))) np.随机.种子(123) df = pd.DataFrame(data=np.random.ran...

将包含日期的列按月拆分为多列。 SQL

我正在尝试根据月份验证登录的用户。 SQL 当前df 用户 ID 日期 P1302 2023-11-01 P1302 2023-10-01 P1302 2023-09-01 P1302 ...

如何从前面的其他列中减去特定列的平均值？

我想从数据集中前 3 列的每个值中减去每个“空白”列的平均值，如下所示： df <- data.frame(da=1:5...

Python Pandas ~ != 和 == 之间布尔索引的差异

我对在 != 之后使用 ~ 与仅使用 == 时使用布尔索引的不同结果感到困惑我有一个有 4 列的 pandas df：迪克 = { “一”：[1,1,1,0,0,1,1], “b&...

查找其中一列发生移动的两列之间的最大值

我的数据框是：将 pandas 导入为 pd df = pd.DataFrame( { “一”：[20,9,31,40], 'b': [1, 10, 17, 30], } ）预期输出：创建列 c ABC 0 20 1 20 1 9...

DT::DTOutput 仅在第一行放置样式

我有一个数据框df。我想知道是否可以仅在第一行添加样式，我想突出显示计算缺失值的行，并且我希望在

模块“pandas”没有属性“read_csv

将 pandas 导入为 pd df = pd.read_csv('FBI-CRIME11.csv') 打印（df.head（））运行这个简单的代码会出现错误：回溯（最近一次调用最后一次）：文件“C:/Users/Dita/Desktop/python/les...

前一天数据填写N/A

我有一个数据框，它只有工作日的数据。以下是示例数据框：将 pandas 导入为 pd df = pd.DataFrame({'BAS_DT': ['2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05', '2023-01-05 ...

在 R 中查找多列中的字符串

我有多个列，其中包含相似的数据，并且我有多个单词，我想知道它们是否在其中一列中。举个例子： df = data.frame(ttt1= c("METO",&q...

Pyspark - 按列表循环数据帧列

pyspark 新手。只是尝试简单地循环变量列表中存在的列。这是我尝试过的，但不起作用。列列表 = ['colA','colB','colC'] 对于 df 中的 col：如果 col 在

JUNIT 测试用例-Spark JDBC

我是 Java 编程的新手。我有一个从Oracle数据库读取数据的方法。现在我需要帮助使用 JUnit 框架为以下代码编写测试用例。数据集 df = Spark.read().

合并索引上的两个数据帧，去掉 key_0

我想通过索引列合并两个数据帧。我的代码是：将 pandas 导入为 pd 将 numpy 导入为 np df1 = pd.DataFrame({'a': ['红色', '红色', '红色']}) df2 = pd.DataFrame({'b': [1, 2, 2]}) df = ...

Polars：在 select/with_column 调用中添加一些列的总和

我想添加一列，它是所有列的总和，但一些带有极坐标的 id 列。这可以使用 Polars.DataFrame.sum(axis=1) 来完成：将极坐标导入为 pl df = pl.DataFrame( { &

将 R 中 3 个变量的总和重新调整为恰好等于 1

我有一个如下数据框，其中有 3 列，每列代表在单个活动中花费的时间比例。 df <- data.frame(ID = c(1, 2, 3, 4), (time_1 = c(0.25...

df 相关问题

最新问题