pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

Python 使用相交日期时间索引合并或连接多个 dfs

使用 Pandas,您可以将多个数据帧与时间戳列和公共列(在本例中)站、经度、纬度和多个变量列合并在单独的文件中,但不能重复...

回答 1 投票 0

Pandas - 自动检测日期列**在运行时**

我想知道 pandas 是否能够自动检测哪些列是日期时间对象并将这些列读取为日期而不是字符串? 我正在查看 api 和相关堆栈

回答 3 投票 0

为什么 SQLAlchemy 在与 Session 一起使用时会给出错误“num (INTEGER) not a string”,但在与 engine.begin() 一起使用时不会给出错误

我正在尝试批量插入mssql数据库。 应用程序应该从 api 获取数据,将其排列到 pandas.DataFrame 中,强制使用 int 类型 列“num”.astype(int)。 在此之后我

回答 1 投票 0

相同的代码在 Windows 上运行,但在 Linux 上失败:pymysql.err.ProgrammingError: nan 不能与 MySQL 一起使用

我面临一个问题,相同的代码在 Windows 上运行良好,但在 Linux 上失败并出现错误: pymysql.err.ProgrammingError:nan 不能与 MySQL 一起使用 在我的项目中,我计算结果,存储...

回答 1 投票 0

Python pandas:同时对不同列进行平均值和总和

我有一个 pandas 数据框,如下所示: 姓名 错过的信用等级 1 3 10 1 1 12 乙 2 3 10 乙...

回答 3 投票 0

在Python中绘制pandas系列的CDF

有办法做到这一点吗? 我似乎没有一种简单的方法可以将 pandas 系列与绘制 CDF(累积分布函数)连接起来。

回答 11 投票 0

Pandas 过滤 - 非索引列上的 Between_time

我需要过滤掉特定时间的数据。 DataFrame 函数 Between_time 似乎是执行此操作的正确方法,但是,它仅适用于数据帧的索引列;但我需要...

回答 2 投票 0

Pandas 数据框列减法,处理 NaN

我有一个数据框例如 df = pd.DataFrame([(np.nan, .32), (.01, np.nan), (np.nan, np.nan), (.21, .18)], 列=['A','B']) 甲乙 0 南 0.32 1 0.01 南 ...

回答 2 投票 0

使用极坐标进行分组变换 lambda ewm

我正在尝试使用极坐标为以下代码找到更快的替代方案 df['ewm'] = df.groupby(['出口', '产品'])['销售'].transform(lambda x: x.shift(shift).ewm(com=10).mean()) 请找到...

回答 1 投票 0

通过 PHP shell_exec 调用 Python3 时可能出现 pandas 和 matplotlib 导入错误

当尝试通过 PHP shell_exec() 函数执行两个不同的 Python 3 脚本时,我遇到了奇怪的行为。第一个 Python 脚本在 PHP 中的调用方式如下: $jsondatash =

回答 1 投票 0

Pandas.read_csv() FileNotFoundError 即使文件存在

我尝试在我的 Anaconda Jupyter Notebook 中运行这段 Python 3 代码(同一单元格,没有其他内容): train = pd.read_csv('tutorial\labeledTrainData.tsv', header=0, delimiter=" ", quoting=3) #好的!

回答 3 投票 0

在分组数据框中添加自定义算术聚合以及 pandas/python 中的 .agg 函数

我是一名 R 用户,现在也在从头开始学习 Python。 我有这个样本数据框。 我想按名称和财政年度对 df 进行分组,然后添加销售额总和以及每月平均销售额...

回答 1 投票 0

如何在单个 jupyter 单元格中显示多个 pandas describe() 输出?

这是一个非常基本的问题,但我一直找不到答案: 在 Jupyter 中,如果我在同一单元格中执行两个 pandas df.describe() 调用,则仅显示最后一个的输出。同样的...

回答 2 投票 0

类型错误:数据类型“日期时间”无法理解[重复]

我正在尝试使用下面的脚本上传一个巨大的 csv 文件,但出现错误 header = ["SKU","STORAGE_AREA","MOVE_TYPE","ORDER_NO","ORDER_ITEM",...

回答 2 投票 0

使用最佳可用组合加入 2 个 pandas 数据框

考虑到我有 2 个数据帧 df1 和 df2,有 2 个关键列 key1 和 key2。我正在寻找一种方法来连接这两个数据帧,忽略空白并生成 df3 作为输出。 输入 1 (df1) 键1 键2...

回答 1 投票 0

如果列数超过 25,Pandas group by 会失败

当我使用 25 列运行该组时,它工作正常,但如果我添加更多列,它会返回 grouped_df = df.groupby(列[:26]).apply( 类型错误:reset_index() 得到了意外的关键字参数“name” ...

回答 1 投票 0

使用对应于同一名称的多个变体的唯一ID来统一pandas数据框中的名称的最有效方法

我正在对一个 DataFrame 进行一些数据分析,该 DataFrame 包含一些具有唯一 id 的列和一些具有某些名称的列,其中每个唯一 id 对应一个名称,“尽管相同的 id 可以对应......”

回答 1 投票 0

使用 Python 3.9,如何从 URL -> https://www.tamoil.ch/en/store-locator 获取 MS Excel 中的所有物理地址

我想从这个url [https://www.tamoil.ch/en/store-locator]获取MS-excel中的所有物理地址。 电子表格只有标题,但没有代码的输出。 导入请求 来自...

回答 1 投票 0

Pandas DataFrame - KNNImputer 算法实现

我有一个包含缺失值的数据集,我想按组填充它们。我使用了 groupby() 方法,效果很好。但我想使用 KNNImputer 算法做同样的事情。 代码我有...

回答 1 投票 0

有人可以帮我找出从 zip 文件夹中提取和合并 csv 文件的代码有什么问题吗? [已关闭]

# 查找具有相关关键字(VTE、CLI、ART)的 ZIP 文件的功能 def find_zip_files(month_folder_path): zip_files = {“vte”:无,“cli”:无,“art”:无} #

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.