dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。


Streamlit 绘图 2 个图表

我是 Python 和 Streamlit 的新手,在 Streamlit 上绘制两个图表时遇到问题。 在 jupyter 笔记本上,它可以很好地使用以下代码: train_size = X_train.shape[0] f,axs = plt.subplots(1,2,图...

回答 1 投票 0

pySpark:如何从数组创建动态地图

我有一个数据框,每个主题和最喜欢的主题都有标记 `数据= [ (1, 85, 90, 78, 88, 92, 75, 80, [“数学”, “科学”]), (2, 70, 95, 82, 79, 85, 88, 91, ["

回答 1 投票 0

在任何用例中迭代数据帧时,iterrows 是否比 itertuples 更快?

我在许多文档中读到,在迭代数据帧时,itertuples 比 iterrows 更快。但在实现时,itertuples 相对较慢。我为此编写了一个测试代码。可以

回答 1 投票 0

Snowpark DataFrame:为什么同一个类方法有这么多同义词?

我怀疑这一定是为了向后兼容。我只是想找出背后的原因。 Snowpark DataFrame API 的灵感来自 Apache Spark DataFrame API。 但为什么...

回答 1 投票 0

ValueError:索引器与 pandas DataFrame 中的系列不兼容

蟒蛇:3.11 熊猫:2.2.2 我需要为 df 中的第四行分配一个 dict 值: df = pd.DataFrame({'agg': [无] * 5}) df['agg'] = df['agg'].astype(object) df.loc[3, 'agg'] = {'mm': 4} 它给出了一个呃...

回答 1 投票 0

Pandas 中的 groupby 对象是否存储原始数据帧的内容

我有一个 DF,其中包含名为 A、B 和 C 的三列。我的目标是查看 groupby 是否存储 DF 的副本。我的测试代码片段如下: # 用 A、B、C 列创建 Df。 grp = df.groupby(by=['A', 'B...

回答 1 投票 0

pandas 数据帧作为另一个不同长度的数据帧的查找表

我有一个小的 pandas 数据框,其中包含只有几行和三列的数据: 将 pandas 导入为 pd df_size = pd.DataFrame([[0.510,0.450,0.540], [0.899,0.820,1.15...

回答 1 投票 0

将数据划分为 x # 行和 x # 列

我有 15,125 个数据点(都是数字),我想将这些数据划分为一个 125 行和 121 列的数据框。数据是它们应该落入这些行和列中的顺序。我哈...

回答 1 投票 0

在 Python 中解析多管道分隔表

我想创建一个函数,使用这个字符串来创建一个表格,即使有中断,它也能正常工作,如下例所示 当一段数据被成对的管道包围时,它......

回答 1 投票 0

将 pandas 系列中具有相同元素但顺序不同的列表合并为一个唯一列表

考虑这个简单的数据框: df = pd.DataFrame({'类别' :[['餐厅', '披萨'], ['披萨', '餐厅'], ['餐厅', '墨西哥']]}) df: 问题是第一个类别...

回答 1 投票 0

如何使用 Python 中列表中的值有条件地更新 Polars DataFrame 中的列?

我正在尝试更新极坐标数据框中的特定行,其中两列(“季节”和“周”)满足某些条件,使用列表或系列中应对齐的值...

回答 1 投票 0

如何拆分/切片数据帧列中的值并将它们添加到新列中,后跟字符串?

我有一个数据框,其中包含“年份”列。我正在尝试使用该列的值来创建标题为“Decade”的新列的值,输出为 st...

回答 1 投票 0

使用“str.contains”方法过滤 pandas 数据框字符串列

我的数据框看起来像这样,其中 long_category 反映了行中的企业类别: df = pd.DataFrame({ 'long_category': {0: '医生、中医、自然疗法/

回答 2 投票 0

将两个数据帧按元素组合为长格式

我有两个dfs, df1 ARHGEF10L HIF3A RNF17 RNF10 RNF11 NCBP1 南 -0.432931 南 -0.233554 0.165081 NCBP2 0.184332 -0.077655 0.331873 -0.449421 0.153836 RPL37 ...

回答 2 投票 0


合并两个数据帧并保留非缺失条目

我有两个这样的数据框: df1 <- data.frame(id= 1:4, sex= c("m", "m", NA, NA)) df2 <- data.frame(id= 1:6, sex= c("m", NA, "m", NA, "m"...

回答 1 投票 0

为什么 Pandas itertuples 在具有许多(> 100)列的数据帧上比 iterrow 慢?

在不幸的情况下,循环 Pandas 数据帧的行是唯一的方法,通常会提到 itertuples() 优于 iterrows()

回答 1 投票 0

高效读取pandas数据框中的数据并获取一定范围内的平均值

我正在从一些文本文件中读取大量数据并将其保存到数据帧中,以便在稍后处理数据时能够轻松访问列。我感觉我现在的样子

回答 1 投票 0

根据 R 数据框中另一个变量的不存在值创建一个新变量

我知道标题听起来很基础,但我没有通过搜索找到解决方案。 我有一个像这样的数据框,其中 id 指的是参与者: 身份条件 1 0 1 0 1 1 1 2 2 0 2 0 2 1...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.