pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

从 pandas 列中提取第一个数字序列

我已将 CSV 导入到 pandas 数据框中;然而,我需要使用的列是自由形式且形状不佳。 我需要提取单词 NBU 或第一个系列

回答 1 投票 0

pandas 清理列中的自由格式数据

我已将 CSV 导入到 pandas 数据框中;然而,我需要使用的列是自由形式且形状不佳。 我需要提取单词 NBU 或第一个系列

回答 1 投票 0

Python pandas 清理列中的自由格式数据

我已将 CSV 导入到 pandas 数据框中;然而,我需要使用的列是自由形式且形状不佳。 我需要提取单词 NBU 或第一个系列

回答 1 投票 0

取消 pandas json 列的嵌套并保留“id”列

我正在处理一些嵌套的NoSQL数据。我想使用 json_normalize 取消嵌套它,但保留“id transação”列,以便我可以将生成的数据帧合并到其他数据帧中。 我...

回答 1 投票 0

获取功能名称时出现 get_features_name_out 错误

我想知道特征对我的数据的重要性,所以我使用 permutation_importance。当我得到结果时,似乎该功能已经解码,我想使用

回答 1 投票 0

python 中 pandas 中 DataFrame 的 dropna 中的阈值

df1 = pd.DataFrame(np.arange(15).reshape(5,3)) df1.iloc[:4,1] = np.nan df1.iloc[:2,2] = np.nan df1.dropna(阈值=1,轴=1) 好像没有删除nan值。 0 1 2 0 0 ...

回答 3 投票 0

取消嵌套 pandas json 列并保留“id”列

我正在处理一些嵌套的NoSQL数据。我想使用 json_normalize 取消嵌套它,但保留“id transação”列,以便我可以将生成的数据帧合并到其他数据帧中。 我...

回答 1 投票 0

如何将此数据拆分为数据框中的行,并使用 pandas 进行列名

我的数据的每一行看起来都是这样的: 8,0 0 1 0.000000000 8082 WS 24664872 + 8 <- (8,2) 23604576 I'd like to split the data into columns like this: col1 col2 c...

回答 1 投票 0

使用 Pandas 2.2.3+ 将数据框中的列映射到新类型

我习惯了能够做这样的事情: 将 pandas 导入为 pd df = pd.DataFrame( pd.Categorical(['a','b','b'],['a','b']),列=['x']) df.loc[:,'x'] = df['x'].replace({'a':1, 'b':2}) 然而,随着

回答 1 投票 0

FutureWarning:设置不兼容的数据类型的项目已被弃用,并将在 pandas 的未来错误中引发

这是示例代码: 将 pandas 导入为 pd 数据 = { 'id': ['id1', 'id2', 'id3', 'id4'], 'col1': [41, 41, 41, 41], 'col2': [6,6,6,6] } df = pd.DataFrame(数据) df.iloc[:,1:] = df.il...

回答 1 投票 0

问题将 int 转换为在切片数据帧上浮动

这是示例代码: 将 pandas 导入为 pd 数据 = { 'id': ['id1', 'id2', 'id3', 'id4'], 'col1': [41, 41, 41, 41], 'col2': [6,6,6,6] } df = pd.DataFrame(数据) df.iloc[:,1:] = df.il...

回答 1 投票 0

熊猫从长到宽,同时保留现有的柱子?

我正在尝试操作 Pandas 中的数据框并遇到一些问题。我查看了这里提出的问题的一些变体,其中大多数涉及使用枢轴和丢弃......

回答 2 投票 0

使用 lambda 在方法链中的 pandas 中分配变量的性能问题

在使用 pandas 数据帧时,我喜欢使用方法链,因为它使工作流程类似于 R 中的 tidyverse 方法,在该方法中使用一串管道。 考虑一下这个例子

回答 1 投票 0

如何为排序的多索引数据框添加一行?

我有一个多索引数据框,它来自groupby。 这是一个演示: 在[54]中: df = pd.DataFrame({'color': ['blue', 'grey', 'blue', 'grey', 'black'], 'name': ['pen', 'pen' 、‘铅笔’、‘铅笔’、‘...

回答 1 投票 0

如何根据列值创建csv文件[重复]

我在 pandas usa_df 中有一个主数据集,如下所示 usa_df = { “state_name”:[“阿拉巴马州”,“阿拉巴马州”,“阿拉斯加”,“阿拉斯加”,“阿肯色州...

回答 1 投票 0

使用 Python 以对数尺度插值电池容量数据

我正在根据小时率、容量和电流之间的关系来插值电池容量数据。这是我的数据示例: 将 numpy 导入为 np 将 pandas 导入为 pd 来自 sc...

回答 1 投票 0

Python:如何为pandas数据框中的每个ID保存不同的.csv? [重复]

我有一个数据框 df ,如下所示: df ID值 0个3 1 A 2 2B 0 3B 5 4B 4 我想为每个用户保存不同的数据框。 T...

回答 1 投票 0

如何根据列值递归创建csv文件

我在 pandas usa_df 中有一个主数据集,如下所示 usa_df = { “state_name”:[“阿拉巴马州”,“阿拉巴马州”,“阿拉斯加”,“阿拉斯加”,“阿肯色州...

回答 1 投票 0

将 Pandas Dataframe 从多索引列转换为没有重复的单个索引

我正在比较两个数据框并在值级别显示数据框之间的更改值 当数据框中的值不同时,我得到了预期的结果,但是......

回答 1 投票 0

Pandas 在处理 10,000 行后速度变慢

我正在开发一个小函数,使用 pandas 对 csv 进行简单的清理。这是代码: def clean_charges(conn, cur): charge = pd.read_csv('csv/all_charges.csv', parse_dates=['已创建...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.