pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

从pandas导出到_excel而不带行名称(索引)?

我正在尝试将 pandas 中的数据框打印到 Excel 中。这里我使用 to_excel() 函数。但是,我发现Excel中的第一列是“索引”, 0 2021年6月6日 0:00 2021年8月6日 0:00 1...

回答 4 投票 0

重命名基于字典的数据框列并开始

因此,在我使用的数据中,有些列的名称末尾经常有更新日期,但总是以相同的开头。另外,列名有时很长,所以要使用它,我想要......

回答 1 投票 0

如何在 pandas 中将 NaN 转换为 'N/A'?

如何在 Pandas 中将 NaN 转换为 N/A? 任何想法和建议都表示赞赏!

回答 2 投票 0

TypeError:tokenize_data() 获得意外的关键字参数“batched”

我正在尝试使用 BERT 和 HuggingFace 转换器库对推文进行情感分析。我面临以下错误,尽管正在寻找可能的解决方案,但我不确定如何解决它......

回答 1 投票 0

pandas 在 google colab 中找不到本地 csv 文件[重复]

我尝试在 google colab 中打开一个从互联网下载的 csv 文件,它位于我的下载文件中。完整路径是: C:\用户\华硕\下载 所以我上网查了一下,上面说要 ch...

回答 2 投票 0

使用 Pandas json_normalize 函数时,在我为某些部分传递的 JSON 中“record_path”不存在

json_data = [ { "meta_info": {"id": 1, "name": "Alice"}, “数据”:[{“值”:100},{“值”:200}] }, ...

回答 2 投票 0

pandas 找不到 csv 文件

所以我尝试打开一个从互联网下载的 csv 文件,它位于我的下载文件中。 所以完整路径是 C:\用户\华硕\下载 所以我上网冲浪,它说要改变 backslas...

回答 1 投票 0

如何计算整个 pandas 数据集的成对互信息?

我的数据框中有 50 个变量。 46 个是因变量,4 个是自变量(降水量、温度、露水、雪)。我想计算我的依赖者的互信息

回答 2 投票 0

如何使用不同数据帧的汇率转换价格

我有3个数据框。 在第一个中,我以 id_share 作为列的价格 在第二个中,我有 id_share 和 cotation 货币 在第三个中,我有货币的汇率

回答 1 投票 0

如何将同列同行的dfs合并成一个只有一个类别的新df?

我是熊猫新手,我正在尝试汇总一些数据,所以如果这是基本问题,请原谅这个问题。我看了很多以前的帖子,但似乎找不到解决方案。 我有多个 dfs...

回答 1 投票 0

如何在matplotlib中绘制从Excel工作表导入的多个数据集?

我需要帮助将 excel 中的数据绘制到 matplotlib 中。数据取自一张工作表。这些列具有相似的结构:列 a -x 值、列 b - y 值、列 c - x 值,...

回答 1 投票 0

用 Pandas 数据帧(时间戳)中的 NaN 替换未知字符串值 - Python

我正在研究一个大pandas df,格式如下: 指数 结束 0 01:02:31 1 01:02:31 2 01:02:30 3 01:02:31 4 01:02:31 ... ... 311218 南 311219 南 311220 南 311221 南 3112...

回答 1 投票 0

根据条件组合df中的两个级别标题

我有来自具有双标题的excel文件的df。 df 看起来像这样,但前两行实际上是标题: 姓名 未命名 年龄 未命名 国家 未命名 有没有办法结合...

回答 1 投票 0

带参数的 Pandas read_sql 给出 PostgreSQL 数据库的“类型错误:dict 不是序列”

我正在尝试使用 Pandas 的 SQL 查询参数: 将 pandas 导入为 pd 从 sqlalchemy 导入 create_engine 引擎 = create_engine('postgresql:///mydb') conn = 引擎.connect() sql = ''' S...

回答 1 投票 0

合并 pandas 中的数据帧后很难删除不同列之间的重复项

我正在与 Excel 工作表进行比较,并从每个文件的相同列创建数据框。我正在尝试将比较的数据帧输出到新的 Excel 文件,但我只想要唯一的值...

回答 1 投票 0

如何将一列中的值与另一列中该值之前的所有值进行比较?

我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { ‘高’: [100, 102, 120, 150, 125, 115], “目标”: [99, 105, 118, 108, 140, 141] } ) 预期输出正在创建列...

回答 1 投票 0

如果子字符串包含字符串,pandas 列部分子字符串将替换为另一个数据框列

当我尝试用另一个数据帧中的字符串替换字符串时,我遇到了替换问题。 以下是我的数据: 将 pandas 导入为 pd 数据={“ID”:[“zx125”,“zx137”,&...

回答 1 投票 0

创建一个新数据集,显示每列的“平均值”

我有一个如下所示的数据框: 氮 地方 数字 C H 乙 G D 1 安格斯 25 33 45 23 60 43 2 阿吉尔 43 23 12 56 19 45 3 艾尔什 14 46 27 92 14 12 我想创建一个迭代 t 的函数...

回答 2 投票 0

并行化代码时如何保存两个单独的 CSV?

我目前正在运行此代码 def single_iteration(iter:int): 一些参数=100 do_somthing_get 数据1、数据2、数据3、数据4 结果=[] 对于范围(100)内的 i: 数据 = {'Col1'...

回答 1 投票 0

应用 Python Pandas 进行分组的更快方法?

如何让 Groupby Apply 运行得更快,或者如何以不同的方式编写它? 将 numpy 导入为 np 将 pandas 导入为 pd df = pd.DataFrame({'ID':[1,1,1,1,1,2,2,2,2,2],\ '价值...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.