pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

使用np.where基于滚动窗口计算更新pandas数据框列

我有下面的代码,可以根据列“A”的滚动窗口计算将数据框列“标志”更新为是或否(“A”中的滚动窗口值应具有最小值> 100 a。 ..

回答 1 投票 0

将带有字典对象的 pandas 数据框转换为带有对象类型的 Polars 数据框

我有一个带有一列字典的 pandas 数据框。我想将其转换为带有 dtype Polars.Object 的极坐标数据框,它显然包装了任意 Python 对象。我想不通...

回答 1 投票 0

如何优化在 python 中提取消息的正则表达式模式的性能?

我需要一个正则表达式模式来创建一个包含三个独立列的 Pandas DataFrame:日期、用户和消息。我相信正则表达式是这种情况的最佳选择,但如果有其他方法可以......

回答 1 投票 0

Python PywedgeCharts dataFrame.drop() 错误

我尝试将 Pywedge_Charts 与 csv 文件(具有 3 列(“State”、“Taxes”、“Revenues_year”)的简单 csv 文件一起使用,编码如下: 将 pandas 导入为 pd 将 pywedge 导入为 pw 税 = pd.read_...

回答 2 投票 0

fill_ Between 图在 pandas 时间序列的特定索引值组合上失败

我尝试绘制一个图并观察到一个奇怪的错误: 将 pandas 导入为 pd 将 matplotlib.pyplot 导入为 plt idx = pd.TimedeltaIndex(['0 天 00:00:00', '0 天 06:00:00', '0 天 12:00:00', '0 天 18:00:...

回答 1 投票 0

什么时候应该将 Age 列转换为 float 或 int?

我有这个疑问,通常数据集的 Age 列值采用 int 或 float 数据类型(例如泰坦尼克号)。 因此,假设该列具有所有浮点值,您应该将它们全部转换为 int 还是顺其自然......

回答 2 投票 0

使用python合并表

我想在python中合并一些'n'表。每个表有 2 列。目前,我正在尝试使用这 3 个表(table12、table13、table23)。 上下文:我有某些图像文件,每个图像都有...

回答 1 投票 0

如何通过python将整个文本分割成句子部分(通过正则表达式)[关闭]

我需要通过正则表达式将整个文本拆分为 例如: 啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊。 BBBB: BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB。 CCCC:CCCCCCCCCCCCCCCCCC CCCCCCC...

回答 1 投票 0

如何将日期时间列更改为适合机器学习的格式

我有太多日期时间列,我需要将其更改为机器学习合适的格式? 2003-01-09 2022-10-12 23:03:34 向量或其他东西 0.0145132 0.548542 有什么建议吗? 我需要使用...

回答 1 投票 0

我想知道在Pandas merge中比较两个数据时如何避免不必要的重复

导入熊猫 df1 = pandas.DataFrame( { ‘代码’:[‘001’,‘001’], '名称': ['测试1', '测试1'], '日期': ['2024-01-01', '2024-01-01'], '值1...

回答 1 投票 0

如何根据 Python 数据框中每个标识符的行创建编号列?

我有一个如下所示的数据集: df = pd.DataFrame(data = {'ID': ['Bob1','Jeff1','Sally2', 'Bob2','Bob1','Jeff1','Bob1','Willa5','Jeff1', 'Bob1','Sally2'], '日期': ['2024-01-10', '2024-08...

回答 1 投票 0

使用 python pandas 读取 Excel 列,该列具有从日期中提取年份的公式,并为除标题之外的所有行获取 NaN

我有一个 Excel 工作表,其中 A 列填充了日期/时间,N 列仅从日期中提取年份,例如“=YEAR(A2)”。我正在尝试使用某种形式的 python、Openpyxl、Pan...

回答 1 投票 0

如何让 .resample().interpolate() 不忽略不符合规则的数据点?

我有一个不规则时间网格上的时间序列。我想将此数据线性插值到规则的时间网格中。作为一个简化的示例,请查看以下代码: 导入熊猫...

回答 1 投票 0

在知道行号的情况下获取 pandas 行的行索引

我有一个 Pandas 数据帧,它是对另一个数据帧进行过滤的结果,因此行索引不是连续的,因为只有基础数据帧的某些行保留在结果中

回答 1 投票 0

Pandas / Polars:将 JSON 列表写入数据库失败,并显示“ndarray 不是 json 可序列化”

我有多个 json 列,我将它们连接到一个 json 列数组。 DataFarme 看起来像这样 ┌──────────────────────────────────┐ │ json_concat │ │ --- ...

回答 1 投票 0

pandas.Series.resample() 的意外行为

我有一个不规则时间网格上的时间序列。我想将此数据线性插值到规则的时间网格中。作为一个简化的示例,请查看以下代码: 导入熊猫...

回答 1 投票 0

Panda read_csv,忽略包含特定字符串的行

我有一个数据框,其中列出了数据记录器名称和密码。如果数据记录器的密码字段中有空白,则会在我的脚本内生成密码。如果没有通用密码,

回答 1 投票 0

用等量值或多个值替换检测到的异常值

我正在分析一个由 R-R 间隔组成的数据集,这些间隔是秒的几分之一,总共等于 240 秒或 4 分钟。 这些数据中经常存在一些异常值,我可以

回答 1 投票 0

合并数据集时如何高效解决冲突

我想知道如何改进解决冲突的功能。我的想法是,当我在合并时得到三个不同的值时,我为检索到的每个值计算一个分数(相似度比率

回答 1 投票 0

pandas,判断数据框中是否已存在设置值

我正在检查无序值的元组是否已在另一个列表中。我是 Python 新手,所以没有太多使用集合,但我是 pandas 的重度用户,所以很高兴找到这个任务......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.