pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何使用节对 pandas 数据框中的字符串列进行词形还原?

我将 csv 文件读入 pandas 数据框。 我的文本列是 df['story']。 我如何使该列词形还原? 我应该之前标记化吗?

回答 1 投票 0

使用两个具有“年”和“月”信息的独立系列构建热图

我正在处理数据集 d = {'date_add_month': ['二月', '十二月', '十月', '十二月', '四月', '十二月', '三月', '四月'], 'date_add_year': [2014, 2012, 2008, 2009, 2010, 2011,

回答 1 投票 0

如何向 pandas.DataFrame().index 添加后缀/前缀?

我想知道是否有类似于add_suffix的方法,可以为数据帧的索引添加后缀?我当前的解决方法如下所示。 df = pd.DataFrame({'x': [1, 2, 3]}, 索引=[1, 2, 3]) df = d...

回答 2 投票 0

与先知一起预测两组

您好,我正在尝试预测每个商店和商品的以下单位 df.head() ds 物品商店 y 0 2019-01-13 A18-303 31 1.000 1 2021-02-21 104451-N04 3 2.000 2 2021-03-07 K231-G39...

回答 2 投票 0

重命名变量并使用向量中的字符串存储“选择”该变量

我是一名正在尝试学习Python的R用户。 为了进行一些分析,我曾经像这样重命名数据框变量 图书馆(dplyr) 变量=“c” df = data.frame(a=c(8,5,7,8), b=c(9,6,6,8), c=c(0,7,...

回答 1 投票 0


在管道中对目标进行标签编码

我想创建一个管道来对训练特征和目标进行预处理,然后训练模型。数据集会是这样的: v1 v2 目标 0 1 是 1 5 c 无 2 3 f ...

回答 1 投票 0

Python:根据创建时间合并两个数据帧

我有两个 df,两个 df 必须按班级和加入日期合并。请检查以下 df df1 班主任年龄instructor_joining_date 马克 50 2024-01-20 07:18:29...

回答 1 投票 0

将 pyspark 数据帧转换为 json 文件

我下面有一个数据框,想要将该内容写入 .json 文件。 在创建输出文件时,我不需要成功部分日志文件,因此我尝试从数据帧收集()值...

回答 2 投票 0

如何使用 asfreq() 函数处理重复项。还有其他方法可以做到这一点吗?

我有一些来自不同国家不同来源的每小时发电数据。我从ENTSO-E透明平台网站下载数据,发现数据不一致的问题...

回答 1 投票 0

检查数据框中字符串中是否包含空格的子字符串

我正在尝试根据字符串值删除包含字符串的行。为此,我正在寻找字符串中的特定子字符串。我的问题来自于这些子字符串包含 spa...

回答 2 投票 0

用索引名称命名所有行

我有一个奇怪的要求,很容易理解,但在我看来实现起来应该很复杂。我有一个由多个电子表格 excel 组成的数据框(使用 df concat)。 我想用...

回答 1 投票 0

Pandas 具有相同值的密集排名,按顺序排列

我在 Pandas 中有以下 DataFrame: ID 快照日期 行哈希值 奎韦 2024 年 1 月 1 日 123 奎韦 2024 年 1 月 3 日 第456章 奎韦 2024 年 1 月 5 日 第456章 奎韦 2024 年 1 月 7 日 123 注意:row_hash 在 1 月 7 日又变回了......

回答 1 投票 0

如何拆分数据帧,以便连续的数字各自位于自己的数据帧中?

我刚开始使用 python 模块 pandas dataframes,我可能有一个愚蠢的问题。 我有一个大型数据框,其结构如下: 指数 连续数字 idx1 1 idx2 2 idx3 3 我...

回答 1 投票 0

如果前面不存在另一个条件,如何获得满足掩码条件的第一行?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { '关闭': [109, 109, 105, 110, 105, 120, 120, 11, 90, 100], ‘高’: [110, 110, 108, 108, 115, 122, 123, 1120, 1000...

回答 1 投票 0

数据帧图上意外反转的辅助 y 轴

我正在尝试绘制耗电量,首先以 mA 为单位,并带有日期,第二轴以 W 为单位,并带有儒略日。 我参考了这篇 matplotlib 文章,即使该示例完美运行,我...

回答 1 投票 0

给定一个以时间戳为索引的数据帧以及包含 ID 和布尔值的 2 列,为每个 ID 获取一个带有转换布尔值的新数据帧

我有一个 pandas 数据框,有两列和一个索引,它是一个 datettime 对象,第一列是一个 ID,第二列是一个布尔值,对于给定的 ID,布尔列可以是 Tru...

回答 2 投票 0

在 3D 数组 NetCDF 文件中查找每年的最大值(使用 Pandas 或 xarray 的方法?)

我正在尝试从多个 NetCDF 文件中制作一些地图等数据。每一项都包含 5 年的数据。数据采用形状 (14608, 145, 192)(时间、纬度、经度)的 3D 数组。 我

回答 3 投票 0

Pandas 提取电话号码(如果格式正确)

我有一列包含电话号码。它们的格式通常为 (555) 123-4567,但有时它们的格式不同或者不是正确的数字。我正在尝试将此字段转换为...

回答 4 投票 0

ValueError:使用可迭代设置时必须具有相等的 len 键和值 |使用 .at

我正在编写一个推荐 5 种产品的函数。我使用余弦相似度作为相似度度量,并且使用长度为 2 的数组,该数组由每个产品的 t-SNE 特征值组成,例如...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.