pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

条件查找 Altair

我发现使用alt.LookupData查找数据时,返回的是最后一个数据。在下面的示例中,当我在 Lookup_data 中查找字段参数以用于确定...

回答 1 投票 0

为什么Pandas的replace()方法不起作用?

我试图将 df 中的所有列替换为整数的价格,但是由于某种原因,replace() 方法不起作用: df = pd.read_csv(f_name, dtype="string") df = df[df.columns.dro...

回答 1 投票 0

计算不等长时间序列数据的相关系数

假设你有一个像这样的数据框 数据= {'站点':['A','A','B','B','C','C'], '项目': ['x', 'x', 'x', 'x', 'x', 'x'], '日期': ['2023-03-01', '2023-03-10', '2023-03-20', '2...

回答 1 投票 0

如何将 1 个单元格与另一列中的多个单元格动态匹配到字典中并转换 json?

我有一个这样的电子表格。列数据是动态的并且可以以“N”种不同的方式变化。 例如,列“h”可以有“n”个值。我需要将它们与

回答 1 投票 0

计算行中的元素并在 pandas 中创建列计数器

我创建了以下 pandas 数据框: 将 pandas 导入为 pd ds = {'col1' : ['A','A','B','C','C','D'], 'col2' : ['A','B','C','D','D','A']} df = pd.DataFrame(数据=ds) 数据框...

回答 1 投票 0

如何制作新的 pandas DataFrame,其中列作为旧的索引_列对

我有两个 pandas DataFrame: object_1df = pd.DataFrame([['a', 1], ['b', 2]], 列=['字母','数字']) object_2df = pd.DataFrame([['b', 3, '猫'], ['c', 4, '狗']], ...

回答 1 投票 0

pandas 使用正则表达式模式重命名多个列

我有一个如下所示的数据框 ID、US-测试1、US-测试2、US-测试3 1,11,12,13 2,13,16,18 3,15,19,21 我想从我的所有列名称中删除关键字 US - 我尝试了下面的方法,但是......

回答 2 投票 0

pandas 无法隐藏堆叠线图中的 NaN 条目

假设我有以下数据: 日期、发布、计数 2019-03-01,克星,0 2019-03-01,杰西,1 2019-03-01,拉伸,74 2019-08-15,克星,25 2019-08-15,杰西,1 2019-08-15,拉伸,49 2019-10-07,克星,35 2...

回答 1 投票 0

使用Pandas groupby计算加权平均值并处理NaN

我正在尝试使用groupby计算加权平均值。但是,我正在处理数据框中的空值。 df = pd.DataFrame({ '组': ['a', 'a', 'a', 'a'], 'x': [10, 20, np.nan, 2...

回答 1 投票 0

使用Panda groupby计算加权平均值并处理NaN

我正在尝试使用groupby计算加权平均值。但是,我正在处理数据框中的空值。 df = pd.DataFrame({ '组': ['a', 'a', 'a', 'a'], 'x': [10, 20, np.nan, 2...

回答 1 投票 0

ValueError:NaTType 不支持 strftime

在重置索引之前,我尝试使用 dropna 方法删除缺少“日期”值的行,然后出现 KeyError: df.set_index('日期', inplace=True) df = df. Between_time(

回答 1 投票 0

从大型数据帧中删除大量 ID 需要很长时间

我有两个数据框 df1 和 df2 打印(df1.形状) (1042009, 40) 打印(df1.列) Index(['date_acte', 'transaction_id', '金额', ...], dtype='对象') 打印(df2.形状) (734738, 37) 原则...

回答 1 投票 0

如何在 sklearn 中应用对数变换和 MinMaxScaler 创建缩放器

我想将 log() 一起应用于我的 DataFrame 和 MinMaxScaler() 。 我希望输出是 pandas DataFrame() ,其中包含原始数据的索引和列。 我想使用以前使用过的参数

回答 1 投票 0

“无法将具有多列的 DataFrame 设置为单列...”

我有以下数据框: 价格调整收盘收高低开仓量 ema_10 ema_20 ema_40 ema_50 sma_5 sma_...

回答 1 投票 0

如何在另一个 ipywidget 交互函数中正确使用带有 dataframe 参数的函数

从 ipywidgets 导入交互 导入 ipywidgets 作为小部件 将 pandas 导入为 pd 我有一个数据框如下: df = pd.DataFrame(索引 = [1,2,3], 数据 = {'col1':[2,3,5],"col2&

回答 1 投票 0

Pandas / 无法将多列 DataFrame 设置为单列

我有以下数据框: 价格调整收盘收高低开仓量 ema_10 ema_20 ema_40 ema_50 sma_5 ...

回答 1 投票 0

计算 Pandas 中某个时间窗口内每种类型事件的发生次数

我有一个具有以下结构的DataFrame: event_timestamp:每个事件的时间戳。 event_type:事件的类型。 我需要为每个唯一的 event_type 添加一列来计算如何 许多活动...

回答 1 投票 0

st.status 微调器继续不必要地显示,即使我的函数已缓存

这是我的代码: @st.cache_data(show_spinner=False) def fetch_data(): 以 st.status("Buscando datos...", Expanded=True) 作为状态: 时间.睡眠(2) st.write("党派

回答 1 投票 0

无法将数据帧列转换为 int64 数据类型

我有一个问题。 在我的 Pandas DataFrame 中,我有一个名为“job”列的列。我创建了一个简单的自定义转换器,它将映射该列中与作业类型相对应的值。 ...

回答 1 投票 0

尝试合并具有多种条件的DataFrames

这是一个奇怪的问题:我有 3 个数据框,“prov_data”,其中包含提供者 ID 并计算区域和类别(即提供者与这些区域交互的次数以及

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.