pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何使用 Python 从网站上抓取活动链接和联系信息?

我正在尝试使用 Python、requests、Pandas 和 BeautifulSoup 从 RaceRoster 网站 (https://raceroster.com/search?q=5k&t=upcoming) 抓取活动链接和联系信息。目标...

回答 1 投票 0

用最后一行值替换第一行值

我试图从 df col 的最后一行获取值并将其替换为第一个值。我返回一个值错误。 将 pandas 导入为 pd df = pd.DataFrame({'name': ['tom','jon','sam','jane'...

回答 1 投票 0

用最后一行值替换第一行值 - python

我试图从 df col 的最后一行获取值并将其替换为第一个值。我返回一个值错误。 将 pandas 导入为 pd df = pd.DataFrame({'name': ['tom','jon','sam','jane'...

回答 1 投票 0

Pandas Groupby 滚动应用自定义函数(传递数据帧而不是系列)

我需要进行分组,然后滚动并应用自定义函数 这是我的自定义函数: def reg_DOL(组): g = group.copy() if pd.isna(group['lnebit'].iloc[0]) 或 pd.isna(group['lnsal...

回答 1 投票 0

提高 Pandas 合并性能

我特别没有 Pands Merge 的性能问题,正如其他帖子所建议的那样,但我有一个类,其中有很多方法,可以对数据集进行大量合并。 班级里有大约...

回答 4 投票 0

TMDb 电影数据集 - 数据可视化 (EDA)

我的论文项目需要帮助。作为我在英国英格兰大学攻读硕士学位的一部分,我正在研究一个 Python 项目。我通过 Kaggle 平台获得的数据集

回答 1 投票 0

ValueError:尝试从字典创建 pandas DataFrame 时,每列数组必须都是一维的。为什么?

我正在尝试从字典创建一个非常简单的 Pandas DataFrame。字典有 3 个项目,DataFrame 也是如此。他们是: 带有“形状”(3,) 的列表 一个列表/np.array(在不同的

回答 2 投票 0

为什么要保留 NumPy RuntimeWarning

这是一个示例数据,即使没有负数或np.nan,它仍然显示错误消息: 数据: gvkey 销售息税前利润 4 1000 44.8 16.8 5 1000 53.2 11.5 6 1000 42.9 6.2 7 1000 42.4 0...

回答 1 投票 0

Taipy 状态:为什么我的 pandas 数据框不能在我的函数之外更新和访问?

前言,我绝不是开发人员,但我能够在像这样的小项目上成功地修改Python。我正在尝试构建一个网络应用程序,让我上传一个 CSV 文件,该应用程序会处理...

回答 1 投票 0

当设置observed=False时,Pandas groupby 操作会导致巨大的内存分配和相对较小的输入数据帧

当设置observed=False时,我遇到了pandas groupby操作的内存问题。我的输入数据帧相对较小(79,860 行 × 790 列),但操作尝试分配超过...

回答 1 投票 0

清理TMDb电影数据集

我的论文项目需要帮助。作为我在英国英格兰大学攻读硕士学位的一部分,我正在研究一个 Python 项目。我正在清理我已经通过的数据集......

回答 1 投票 0

Python/Pandas - 将邮政编码分解为邮政编码和扩展名

我在 pandas 数据框中有一列,其中包含邮政编码 - 邮政编码 56789-2345 45675 无效的 23445-445 1234-45 34567 我需要将其分解为邮政编码和分机号,如下所示 - 邮政编码...

回答 2 投票 0

引用 pandas.query() 中的 Series 元素

# 设置两个数据框 2024 年人口 = [ [“牙买加”,2.826], [“日本”,124.5], ] Population_2024 = pd.DataFrame( columns=[“国家”,“人口(M...

回答 1 投票 0

将 header pandas 自定义为 html

我创建了一个网络应用程序来搜索 CSV 文件中的内容。目前我只能将所有内容放入 1 列中,并以逗号作为分隔符, 我想显示如图所示的数据。 我的蟒蛇...

回答 1 投票 0

如何在函数中使用字符串连接来更新 Pandas DataFrame 列

我有一个数据框,我想在其中添加完整的地址列,该列将是该数据框中其他 4 个列(街道、城市、县、邮政编码)的组合。 a...的输出示例

回答 1 投票 0

带有分箱值的 Seaborn 线图

我有以下代码和图表: 箱 = [0, 5, 15, 25, 50, 75, 100, 125, 150, 175, 200, 250, 300, 400, 500, 600, 700, 850, 1000, 5000, 100000] df['articles_binned'] = pd.cut(df['文章'], bin...

回答 1 投票 0

无法替换 Panda 系列中的前缀

我有一个 Panda 系列,我正在计算其中的最大值,然后将该最大值与特定值进行比较 但是当我使用 df.max 时,我会从 Pa 中得到最大值...

回答 1 投票 0

如何在 Pandas 的一列中查找 Nan 之前的第一个非 NAN 数据

例如, 我有一些这样的数据: 列 = pd.Series([1,2,3,np.nan,4,np.nan,7]) 打印专栏 执行命令,结果如下: 0 1.0 1 2.0 2 3.0 3 南 4 4.0 5 ...

回答 3 投票 0

有没有办法使用 UDF 将 API 请求中的 json 文件保存到 Snowflake 中的表中?

我正在尝试将从 API 请求获取的 JSON 文件保存为雪花表 我创建了一个 UDF,并且能够从 API 获取响应数据,我尝试使用会话保存此数据。

回答 1 投票 0

将 .loc/.iloc 与元组和链式索引进行比较

将 pandas 导入为 pd # 使用一些示例数据创建一个 DataFrame 数据 = { “姓名”:[杰森、“艾玛”、“亚历克斯”、“莎拉”], ‘年龄’:[28,24,32,27], '城市':['纽约','伦敦','巴黎','到...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.