pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何从Python中字典形式的数据帧列中选择浮点值?

我有一个像这样的数据框: 日期比较 2022 年 1 月 1 日 {'dfp':25.02,'ftp':12.06} 2022 年 1 月 2 日 {'dfp':12.01,'ftp':40.05} 2022 年 1 月 3 日 {'dfp':50.20,'ftp':35.25} 我正在尝试...

回答 1 投票 0

PANDAS 条形图为空且缺少 x 和 y 标签

所以我有以下代码: 将 pandas 导入为 pd 将 matplotlib.pyplot 导入为 plt df = pd.read_csv(r"data.csv") pd.set_option("display.max_columns", None) 打印(df['苏打水'].

回答 1 投票 0

将列中的一组滚动值转置为单元格中的单个值

我在尝试进行数据转换时遇到了麻烦。我有一列数据(例如 1,2,3,4,5,6,7,8,9)我想创建一个新列来查看 n 行并连接我的值...

回答 1 投票 0

将列中的每个值乘以行python

我这里有一小部分数据: 将 pandas 导入为 pd 天 = [1, 2, 3] 时间 = [2, 4, 2, 4, 2, 4, 2, 4, 2] df1 = pd.DataFrame(天) df2 = pd.Series(时间) df2 = df2.转置() df3 = df1*df2 ...

回答 3 投票 0

修剪 Python 数据框中的尾随 NaN 值

有没有办法修剪数据框中每列的尾随 NaN? 熟悉 dropna() 及其参数(例如,轴,如何)来处理类似的东西,但似乎没有解决这个问题...

回答 1 投票 0

将 Pandas Dataframe 中的一条记录与 Dataframe 中的所有其他记录进行比较

我有一种情况,我想将数据帧的一列中的每个值与同一列中的每个其他值进行比较。在这种情况下,对于每一种产品,我都想看到现代的

回答 1 投票 0

为什么第一个条件仅在通过匹配 Python Pandas Dataframe 中的两列来过滤行时执行

我有下面的代码来过滤掉数据中最早的年份和月份的行。我在下面的代码的方法 1 段中使用了逻辑运算符“&”。但是下面代码的方法1段...

回答 1 投票 0

@pytest.mark.parametrize 用于返回两个值的函数

我有一个函数,它接受 pandas DataFrame(重要的是,这个特定的 DataFrame 作为函数的参数,没有列名称)并生成一个带有列的 DataFrame ...

回答 1 投票 0

Pandas 或 pyspark 跨列创建

我有以下形式的样本数据: 周年 flag_1 flag_2 26 2022 0 0 27 2022 1 0 28 2022 0 0 2 2023 0 1 3 2023 1 0 ...

回答 1 投票 0

如何使用节对 pandas 数据框中的字符串列进行词形还原?

我将 csv 文件读入 pandas 数据框。 我的文本列是 df['story']。 我如何使该列词形还原? 我应该之前标记化吗?

回答 1 投票 0

使用两个具有“年”和“月”信息的独立系列构建热图

我正在处理数据集 d = {'date_add_month': ['二月', '十二月', '十月', '十二月', '四月', '十二月', '三月', '四月'], 'date_add_year': [2014, 2012, 2008, 2009, 2010, 2011,

回答 1 投票 0

如何向 pandas.DataFrame().index 添加后缀/前缀?

我想知道是否有类似于add_suffix的方法,可以为数据帧的索引添加后缀?我当前的解决方法如下所示。 df = pd.DataFrame({'x': [1, 2, 3]}, 索引=[1, 2, 3]) df = d...

回答 2 投票 0

与先知一起预测两组

您好,我正在尝试预测每个商店和商品的以下单位 df.head() ds 物品商店 y 0 2019-01-13 A18-303 31 1.000 1 2021-02-21 104451-N04 3 2.000 2 2021-03-07 K231-G39...

回答 2 投票 0

重命名变量并使用向量中的字符串存储“选择”该变量

我是一名正在尝试学习Python的R用户。 为了进行一些分析,我曾经像这样重命名数据框变量 图书馆(dplyr) 变量=“c” df = data.frame(a=c(8,5,7,8), b=c(9,6,6,8), c=c(0,7,...

回答 1 投票 0


在管道中对目标进行标签编码

我想创建一个管道来对训练特征和目标进行预处理,然后训练模型。数据集会是这样的: v1 v2 目标 0 1 是 1 5 c 无 2 3 f ...

回答 1 投票 0

Python:根据创建时间合并两个数据帧

我有两个 df,两个 df 必须按班级和加入日期合并。请检查以下 df df1 班主任年龄instructor_joining_date 马克 50 2024-01-20 07:18:29...

回答 1 投票 0

将 pyspark 数据帧转换为 json 文件

我下面有一个数据框,想要将该内容写入 .json 文件。 在创建输出文件时,我不需要成功部分日志文件,因此我尝试从数据帧收集()值...

回答 2 投票 0

如何使用 asfreq() 函数处理重复项。还有其他方法可以做到这一点吗?

我有一些来自不同国家不同来源的每小时发电数据。我从ENTSO-E透明平台网站下载数据,发现数据不一致的问题...

回答 1 投票 0

检查数据框中字符串中是否包含空格的子字符串

我正在尝试根据字符串值删除包含字符串的行。为此,我正在寻找字符串中的特定子字符串。我的问题来自于这些子字符串包含 spa...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.