pandas 相关问题

Pandas是一个用于数据处理和分析的Python库，例如统计数据，实验科学结果，计量经济学或金融学中常见的数据框架，多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

类型：concat（）采用1个位置论点，但给出了2个我想以列的方式将pandas dataframes串联并重置索引。导入大熊猫作为pd 导入numpy作为NP com_mut = kirc_mut.loc [common_samples] com_mut = com_mut.sort_index（）

import pandas as pd import numpy as np com_mut = kirc_mut.loc[common_samples] com_mut = com_mut.sort_index() com_mut = com_mut.T com_mut = com_mut.dropna() com_mut = com_mut.groupby(com_mut.index).first() com_mut = com_mut.T l=[com_mut[x].apply(pd.Series).stack() for x in com_mut.columns] common_mut=pd.concat(l,1).reset_index(level=1,drop=True)

python pandas

回答 0 投票 0

dataframe.apply行类型

示例数据框：导入大熊猫作为pd d = {'col1'：[1，2，3]，'col2'：[4，5，6]} df = pd.dataframe（d）如果用户想根据以前的列创建新列，则可以创建一个

python pandas dataframe types type-hinting

回答 1 投票 0

更改数据帧标题，但将之前的标题保留为一行

我在数据框上有两个问题：它没有正确的标题当前标题包含应该是数据帧的“简单”（第一）行的值我如何保持当前...

python pandas dataframe header row

回答 1 投票 0

多匹配两个熊猫系列，带有不匹配的指数

创建了两个系列：

python pandas series indices multiplication

回答 2 投票 0

CSV 文件未在预期文件夹中生成。在终端窗口中打印出来

导入请求将 pandas 导入为 pd 将 numpy 导入为 np 导入操作系统 print("将文件保存到：", os.getcwd()) # 定义网址 URL =“https://web.archive.org/web/20230902185326/https://en.

python pandas numpy csv web-scraping

回答 1 投票 0

我如何使大熊猫重新样本在一天不分为24小时的时间范围内对齐？

重新样品功能与5h或10h间隔不起作用。它可以开始，然后停止对齐一天。 d = {'open'：'first'，'high'：'max'，'low'：'min'，'close'：'last'} df = read.resa ...

python pandas pandas-resample

回答 1 投票 0

pandas重新样品在一天不分为24小时的时间范围内不一致

python pandas pandas-resample

回答 1 投票 0

使用一个大型数据帧提高 pandas 合并性能

我有两个数据框 df_X 和 df_Y，我想用合并（how='inner'）来合并这两个数据框（df_X 有 1000 行），当 df_Y 有 1000 行时一切都很好，但对于大数据框来说非常慢(

python pandas performance merge

回答 1 投票 0

高效加载 pandas 数据框的索引

我正在处理大型数据帧，我只想读取其索引，而不必加载整个数据帧。我尝试使用 usecols=0 ，我认为它只会加载第一列，我会

python pandas dataframe performance

回答 1 投票 0

读取多个文件时，列不可见或重复 :)

所以我正在读取多个文件（正好是 30 个）。其中一些具有相同的列，一些具有不同的列等等。 mycsvdir = r'C: \...\dict_full' csvfiles = glob.glob(os.path.join(mycsvdir, '*.csv'))

python pandas dataframe duplicates multiple-columns

回答 1 投票 0

在使用pandas

，我有这个数据框架：导入大熊猫作为pd x = pd.dataframe（[[[1，'step'，'id'，22，33]， [2，'step'，'id'，55，66]]，，列= ['time'，'head_1'，'head_2'，'

python pandas

回答 1 投票 0

带有标签样式列表的 Pandas groupby

我有一个带有“类似标签”分组的数据集：身份标签 0 item1 ['朋友','家人'] 1 项2 ['朋友'] 2 项目3 [] 3 item4 ['家庭','假期'] 所以一行可以属于

python pandas dataframe group-by

回答 1 投票 0

i有一个包含无法估计的行和列的数据框架。 DF的结构是使直到第六排和第二列，我都有字符串为输入，其余的是数字（浮点）。我想要...

原始数据框架（DF）：

python pandas dataframe jupyter-notebook data-manipulation

回答 1 投票 0

假设 - 如何生成具有可变列数的 pandas 数据框

我是假设的新手，我想知道是否有比我在这里所做的更好的方法来使用假设...... 类 TestFindEmptyColumns： def test_one_empty_column(自身): ...

pandas python-hypothesis

回答 1 投票 0

系统的方式pandas dataframe的夏姆列

我有一个看起来像这样的熊猫数据框架： 1_2 1_3 1_4 2_3 2_4 3_4 1 5 2 8 2 2 4 3 4 5 8 5 8 8 8 9 3 3 4 3 4 4 4 8 3 8 0 7 4 2 2 col ...

python pandas dataframe combinations

回答 1 投票 0

如何正确使用Pandas的infer_objects（v.2.2.3）

我在 Pandas 2.2.3 中尝试以下示例： outage_mask = pd.Series(([True]*5 + [False]*5)*5, index=pd.date_range("2025-01-01", freq="1h", period=50)) [ts for ts in outage_mas...

python pandas

回答 1 投票 0

允许x在线性组合拟合期间移动

i有三组数据（x，y）定义唯一的线形。使用线性组合拟合，我想将这三个线形拟合到第四个线形。我可以在下面设置简单的代码：＃在数据中阅读（...

python pandas least-squares lmfit spectra

回答 1 投票 0

想要使用 df.drop(index=array) 删除异常值，但出现错误“在轴中找不到数组”

我的机器学习数据有多个变量，下面是其中一个变量（称为 x）与结果（称为 y）的箱线图。我想删除 x 中的异常值，但仅限于 x =...

python pandas numpy outliers

回答 1 投票 0

Pandas 系列和词典的自定义比较

我有一个系列，有四个类别 A、B、C、D 及其当前值 s1 = pd.Series({"A": 0.2, "B": 0.3, "C": 0.3, "D": 0.9}) 还有一个门槛，我...