pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

提取对是/否标识符的多个稀疏打包响应,同时保留行信息

我有一些来自 Google Sheets 的数据,其中有一个多答案问题,如下所示: Q1 Q2 ... 多重响应 0…………“A;B” 1…………“B;C” 2…………”……

回答 2 投票 0

为什么这个函数会原地改变pd.DataFrame?

就地改变对我来说仍然总是有点奇怪。这是我的代码: 将 pandas 导入为 pd 将 numpy 导入为 np def sort_variantsdf(variantdf_orig): variantdf['variantindex'] = variantdf.index

回答 1 投票 0

Groupby 输出多列

我正在尝试从 groupby 操作中输出多列。 我的输入文件是: 预期输出: 使用的代码: df = pd.read_csv('testPCI.csv') 输出 = df.groupby(['频率'])['PCI'].count().

回答 2 投票 0

openpyxl 中的 IllegalCharacterError 与 ValueError

我需要使用 openpyxl 用 pandas 保存 Excel 文件。 数据来自数据库,很多时候文本字段包含一些奇怪的字符,并引发 IllegalCharacterError。我有一个

回答 1 投票 0

通过输出多列进行分组

我正在尝试通过操作输出一组 我的输入文件是: 在此输入图像描述 预期输出: 在此输入图像描述 使用的代码: df=pd.read_csv('testPCI.csv') 输出= df.gr...

回答 1 投票 0

需要 openpyxl v 3.1 或更高版本的错误,但已安装 openpyxl 3.1

我对 Python 相当陌生,并且开始在我过去一直执行的工作簿上收到一个新错误。 我不断收到以下错误: 导入错误:Pandas 需要版本 '...

回答 1 投票 0

Pandas 在字段开头写入 Excel 转义“=”符号

使用Python Pandas,我想将一些内容写入Excel文件:=)一些文本 如何安全地执行此操作而不出现 Excel 错误?我使用以下代码: 将 pandas 导入为 pd df = pd.Dat...

回答 3 投票 0

Pandas to_excel 会损坏 '='

我在将等号从 DataFrame 写入 Excel 文件时遇到问题: 我读入一个 Excel 文件(我想在将来修改它),并将 DataFrame 写回 Excel 文件。数据框

回答 2 投票 0

来自 tabula-java 的错误,CalledProcessError

我想将 2679 页的 PDF 文件转换为 pandas dataframe,但出现此错误。我该如何修复它? 是不是页面数量太多导致的错误? 你可以看到图片中的错误...

回答 2 投票 0

高效读取部分分区数据集

我有相当大(高达~300Gb)的数据集,由镶木地板格式(压缩)的分区存储。 我正在尝试找到一种有效的方法来将数据集的各个部分(由一组过滤器定义)读入

回答 1 投票 0

来自 SQL Server 的 pandas read_sql_table() 问题

我正在尝试连接到 sqlserver 数据库并将我的数据读入数据框中。 这是我的代码如下: 将 pandas 导入为 pd 将 sqlalchemy 导入为 sq 引擎 = sq.create_engine('mssql://服务器名称/

回答 1 投票 0

2 个日期列比较以指示一条记录是否在另一条记录之后发生

我有一个数据框,我想返回在诊断疾病后进行后续随访的帕蒂尼特的数量(比例)。 原始 DF(1 个患者示例) |患者 ID |应用程序_数据...

回答 1 投票 0

如何使用不同的时间戳对 pandas 时间序列进行插值

我正在寻找一个功能 pandas_interpolate(df: pd.DataFrame, newTime: pd.DatetimeIndex, 方法: str = '线性') -> pd.DataFrame 这将需要一个带有 DatetimeIndex 的现有数据框...

回答 1 投票 0

Pandas/Python 如何根据与特定行的指定间隔最接近的值将数据插入到列行中

我有一个包含一列日期时间数据的数据框,其中我指定了与每个休息周期的开始和结束之间的中点相对应的行(在单独的状态列中)。 ...

回答 1 投票 0

在 MultiIndex 中设置级别值

如何设置系列的级别值,可以使用字典替换值,还是仅使用与系列一样长的值列表? 这是一个示例数据框: 来自_co的部门...

回答 3 投票 0

如何在不丢失样式的情况下替换列值?

这是我的样式数据框: 我想要的是将 aEV 的值发送到 aEV_percentile ,但不会丢失样式,或者更具体地说,不会丢失

回答 1 投票 0

包含混合字母数字字符的数据的数据框排序

问题: 尝试对下面的 Excel 数据数据框进行排序(请注意,这是一个多行的小样本集,其信息范围可以从 A#-Z# 后跟 AA# 等,(就像 Excel 工作表如何...

回答 1 投票 0

Pandas - 提取多个稀疏打包的响应是/否标识符,同时保留行信息

我有一些来自 Google Sheets 的数据,其中有一个多答案问题,如下所示: Q1 Q2 ... 多重响应 0…………“A;B” 1…………“B;C” 2…………”……

回答 1 投票 0

绘制带有时间戳的直方图

我有以下格式的 pandas 时间戳列表: [时间戳('2022-01-01 21:00:00'), 时间戳('2022-01-02 21:15:00'), 时间戳('2022-01-03 21:00:00'), 时间戳('2022-01-04 20:00:...

回答 2 投票 0

查找每个类别组的所有“无”值的列

我有一个与这个虚构的数据集类似的数据集 data = {'category':['foo','foo','foo','foo','foo','bar','bar','bar','bar','bar'],'部分':['101','102','103','104','105','201','202','203','204','205'],'

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.