dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

python 脚本将文件的每一行解析为 excel

我正在开发一个Python脚本来将文件的每一行解析为Excel表。目前,我的脚本正在将数据提取到单列多行的 Excel 中。我担心的是...

回答 1 投票 0

Python中基于条件的累加向量重置

我试图在满足所需条件时重置总和的累积,所有这些都以矢量化方式进行,而不使用循环。我将首先展示一个简单的示例,然后展示真正的问题。 进口...

回答 1 投票 0

Python TypeError:无法连接类型为“<class 'str'>”的对象;仅 Series 和 DataFrame 对象有效

我收到以下错误: 类型错误:无法连接“”类型的对象;仅 Series 和 DataFrame 对象有效 回溯(最近一次调用最后一次): 文件“/var/...

回答 1 投票 0

Python Polars:如何获取 LazyFrame 的行数?

我的 CSV 文件大小为 70 GB。我想在惰性模式下加载 DF 并计算行数。最好的方法是什么? 据我所知,lazy m 中没有像 shape 这样的函数...

回答 2 投票 0

如何从 Pandas 数据框中制作多列的多个图?

假设我有一个像这样的数据框,其中包含年份、月份、最大值、最小值: 年 月 最大组合 2000年 1 3.0 0.30 2000年 2 3.7 0.70 2000年 3 3.6 0.60 2001年1 2.4 1.40 2001...

回答 1 投票 0

ggplot2 中的长格式数据的折线图和点图

在下面的数据中,我只需在 x 轴上绘制年份(一个因素),在 y 轴上绘制出勤率(一个数字),并根据组对线条进行颜色编码。 然而,情节是如此的古怪。一个...

回答 1 投票 0

Julia 中的数据帧爆炸

我有一个像这样的 Julia 数组: 任意[任意[["link_1", "link_2", "link_3"], "82", ["A B", "C D", "E F", "G H", "I J&...

回答 1 投票 0

错误 AttributeError:“DataFrame”对象没有属性“append”,尝试了 pd.concat 但也导致错误

收到错误 AttributeError: 'DataFrame' 对象没有属性 'append 当尝试运行以下命令时: new_df.append({'Obs_Date': day_row['Obs_Date'], 'From_Currency': day_row['From_Curren...

回答 1 投票 0

我在 Pandas 中“groupby”的列会发生什么?它仍然存在于新的数据框中吗?

假设我有一个带有“A”列的数据框 df1。我按操作分组 df2 = df1.groupby(["A"]).sum() 创建一个新的数据框 df2。 当我显示新的数据框 df2 时,我可以...

回答 1 投票 0

迭代多个数据帧

##1 M_成员 = [1000, 1450, 1900] M = pd.DataFrame(M_members) ##2 a_h_members = [0.4, 0.6, 0.8] a_h = pd.DataFrame(a_h_members) ##3 d_h_members = [0.1, 0.2] d_h = pd.DataFrame(d_h_m...

回答 4 投票 0

在面板 RStudio 中选择最近的日期

我有一个数据框,它是一个面板:我有不同的 CLP(就像事件的 ID)重复多次,每个阶段对应事件的每个阶段:组织、设置、开始、结束、清理-向上。 每个...

回答 1 投票 0

栏中间文字自动调整

我有一个名为 df 的数据框: df = tibble(var =c("A","B","C","D","E"), val = c(2,8,9,1,5) );df 结果是: 瓦尔瓦尔 我有一个名为 df 的数据框: df = tibble(var =c("A","B","C","D","E"), val = c(2,8,9,1,5) );df 导致: var val <chr> <dbl> 1 A 2 2 B 8 3 C 9 4 D 1 5 E 5 我想水平绘制 val 列的条形图,并将每个类别的值以文本形式绘制在条形图中间。 ggplot(df, aes(x = var, y = val)) + geom_bar(stat = "identity", fill = "lightgrey") + coord_flip() + # This flips the coordinates to make the bars horizontal geom_text(aes(label = val)) 导致: 如何将值(文本)自动放置在水平条的中间? 您可以使用 position = position_stack(vjust = .5) 将标签放入条形中间: library(ggplot2) ggplot(df, aes(x = val, y = var)) + geom_bar( stat = "identity", fill = "lightgrey" ) + geom_text( aes(label = val), position = position_stack(vjust = .5) ) 除以2: ggplot(df, aes(x = var, y = val)) + geom_bar(stat = "identity", fill = "lightgrey") + geom_text(aes(x = var, y = val/2, label = val)) + coord_flip() 在基地 X = data.frame(var =c("A","B","C","D","E"), val = c(2,8,9,1,5)) with(X, { barplot(val, horiz=TRUE, names.arg=var, las=2L, xaxt="n") |> text(x=val/2L, labels=val) axis(side=1L, at=seq(0L, max(X$val), 2.5)) } )

回答 3 投票 0

栏中间文字自动调整

我有一个名为 df 的数据框: df = tibble(var =c("A","B","C","D","E"), val = c(2,8,9,1,5) );df 结果是: 瓦尔瓦尔 我有一个名为 df 的数据框: df = tibble(var =c("A","B","C","D","E"), val = c(2,8,9,1,5) );df 导致: var val <chr> <dbl> 1 A 2 2 B 8 3 C 9 4 D 1 5 E 5 我想水平绘制 val 列的条形图,并将每个类别的值以文本形式绘制在条形图中间。 ggplot(df, aes(x = var, y = val)) + geom_bar(stat = "identity", fill = "lightgrey") + coord_flip() + # This flips the coordinates to make the bars horizontal geom_text(aes(label = val)) 导致: 如何将值(文本)自动放置在水平条的中间? 除以2: ggplot(df, aes(x = var, y = val)) + geom_bar(stat = "identity", fill = "lightgrey") + geom_text(aes(x = var, y = val/2, label = val)) + coord_flip() 您可以使用 position = position_stack(vjust = .5) 将标签放入条形中间: library(ggplot2) ggplot(df, aes(x = val, y = var)) + geom_bar( stat = "identity", fill = "lightgrey" ) + geom_text( aes(label = val), position = position_stack(vjust = .5) )

回答 2 投票 0

Pandas - 将多索引数据框中的列转换为行

如何转换以下 pandas 数据框: dw1 dw2 db_c c_data a e c_idx b f db_s s_dat c g s_idx d h 对此: db_c c_dat dw1 a...

回答 1 投票 0

我使用 pandas 和 python 编写了代码。我想将代码转换为一个新的数据帧,并将输出分为两列

我从一个数据框转到另一个数据框,并对每个独特的人的姓名旁边的列进行计算。现在我旁边有名称和计算的输出,我想将其分成两个...

回答 2 投票 0

如何使用该行最后一个非空单元格中的值填充数据帧每行中的空单元格?

我有一个包含不完整行的数据框(或数据表,如果更容易的话): ID Var1 Var2 Var3 1 2 5 1 2 12 3 3 8 4 4 d <- data.frame( ID = 1:4, Var1 = c(2, 12, 8, 4), ...

回答 6 投票 0

使用 Pandas 中另一个函数的值 .Applymap()

是否可以根据 DataFrame 单元格值与另一个函数返回的值进行比较来对 DataFrame 单元格值进行颜色编码。 这是我使用 fun 创建的 DataFrame 着色示例...

回答 1 投票 0

如何将文件名添加到Polars pl.scan_csv()?

我正在使用 Polars 读取多个文件,但我想在新列中添加文件名作为标识符。 #如何向极坐标添加文件名 lazy_dfs = (pl.scan_csv("data/file_*.tsv", 分隔符=&qu...

回答 1 投票 0

根据另一列中的值查找连续炎热天气

我有一个如下的数据框,我想找到连续的炎热天气。 日期= pd.date_range(开始='1-1-2018',结束='1-10-2018',频率='1D') np.随机.种子(42) temp = np.random.randint(60, 80, 大小=1...

回答 1 投票 0

如何根据分组和日期重新分配值 (R)

我有一个如下所示的数据框: grp1 <- c('A','A','A','A','A','A', 'B','B','B','B','B','B', 'C','C','C','C','C','C') grp2 <- c('PQ2','PQ2','PQ2','PQ2','P...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.