pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

类型:concat()采用1个位置论点,但给出了2个 我想以列的方式将pandas dataframes串联并重置索引。 导入大熊猫作为pd 导入numpy作为NP com_mut = kirc_mut.loc [common_samples] com_mut = com_mut.sort_index()

import pandas as pd import numpy as np com_mut = kirc_mut.loc[common_samples] com_mut = com_mut.sort_index() com_mut = com_mut.T com_mut = com_mut.dropna() com_mut = com_mut.groupby(com_mut.index).first() com_mut = com_mut.T l=[com_mut[x].apply(pd.Series).stack() for x in com_mut.columns] common_mut=pd.concat(l,1).reset_index(level=1,drop=True)

回答 0 投票 0

dataframe.apply行类型

示例数据框: 导入大熊猫作为pd d = {'col1':[1,2,3],'col2':[4,5,6]} df = pd.dataframe(d) 如果用户想根据以前的列创建新列,则可以创建一个

回答 1 投票 0

更改数据帧标题,但将之前的标题保留为一行

我在数据框上有两个问题: 它没有正确的标题 当前标题包含应该是数据帧的“简单”(第一)行的值 我如何保持当前...

回答 1 投票 0


CSV 文件未在预期文件夹中生成。在终端窗口中打印出来

导入请求 将 pandas 导入为 pd 将 numpy 导入为 np 导入操作系统 print("将文件保存到:", os.getcwd()) # 定义网址 URL =“https://web.archive.org/web/20230902185326/https://en.

回答 1 投票 0

我如何使大熊猫重新样本在一天不分为24小时的时间范围内对齐?

重新样品功能与5h或10h间隔不起作用。它可以开始,然后停止对齐一天。 d = {'open':'first','high':'max','low':'min','close':'last'} df = read.resa ...

回答 1 投票 0


使用一个大型数据帧提高 pandas 合并性能

我有两个数据框 df_X 和 df_Y,我想用合并(how='inner')来合并这两个数据框(df_X 有 1000 行),当 df_Y 有 1000 行时一切都很好,但对于大数据框来说非常慢(

回答 1 投票 0

高效加载 pandas 数据框的索引

我正在处理大型数据帧,我只想读取其索引,而不必加载整个数据帧。 我尝试使用 usecols=0 ,我认为它只会加载第一列,我会

回答 1 投票 0

读取多个文件时,列不可见或重复 :)

所以我正在读取多个文件(正好是 30 个)。其中一些具有相同的列,一些具有不同的列等等。 mycsvdir = r'C: \...\dict_full' csvfiles = glob.glob(os.path.join(mycsvdir, '*.csv'))

回答 1 投票 0

在使用pandas

,我有这个数据框架: 导入大熊猫作为pd x = pd.dataframe([[[1,'step','id',22,33], [2,'step','id',55,66]],, 列= ['time','head_1','head_2','

回答 1 投票 0

带有标签样式列表的 Pandas groupby

我有一个带有“类似标签”分组的数据集: 身份标签 0 item1 ['朋友','家人'] 1 项2 ['朋友'] 2 项目3 [] 3 item4 ['家庭','假期'] 所以一行可以属于

回答 1 投票 0


假设 - 如何生成具有可变列数的 pandas 数据框

我是假设的新手,我想知道是否有比我在这里所做的更好的方法来使用假设...... 类 TestFindEmptyColumns: def test_one_empty_column(自身): ...

回答 1 投票 0

系统的方式pandas dataframe的夏姆列

我有一个看起来像这样的熊猫数据框架: 1_2 1_3 1_4 2_3 2_4 3_4 1 5 2 8 2 2 4 3 4 5 8 5 8 8 8 9 3 3 4 3 4 4 4 8 3 8 0 7 4 2 2 col ...

回答 1 投票 0

如何正确使用Pandas的infer_objects(v.2.2.3)

我在 Pandas 2.2.3 中尝试以下示例: outage_mask = pd.Series(([True]*5 + [False]*5)*5, index=pd.date_range("2025-01-01", freq="1h", period=50)) [ts for ts in outage_mas...

回答 1 投票 0

允许x在线性组合拟合期间移动

i有三组数据(x,y)定义唯一的线形。使用线性组合拟合,我想将这三个线形拟合到第四个线形。我可以在下面设置简单的代码: #在数据中阅读(...

回答 1 投票 0

想要使用 df.drop(index=array) 删除异常值,但出现错误“在轴中找不到数组”

我的机器学习数据有多个变量,下面是其中一个变量(称为 x)与结果(称为 y)的箱线图。我想删除 x 中的异常值,但仅限于 x =...

回答 1 投票 0

Pandas 系列和词典的自定义比较

我有一个系列,有四个类别 A、B、C、D 及其当前值 s1 = pd.Series({"A": 0.2, "B": 0.3, "C": 0.3, "D": 0.9}) 还有一个门槛,我...

回答 1 投票 0

导入错误:即使安装了 adlsf 后,仍安装 adlfs 来访问 Azure Datalake Gen2 和 Azure Blob 存储

我有一个天蓝色的函数,代码如下: storage_account_url = f“{self.datalake_settings.STORAGE_ENDPOINT}/{parquet_folder_path}/{file_name}.parquet” 存储选项= { “账户...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.