Python：数据框中只有 2 个唯一的列名称，总共 3105 列。如何获取按唯一列名称分组的行平均值

Question

我的数据框位于链接的图像中。基本上为了简单起见，我的数据框目前看起来像这样：

Cell_A 和 Cell_B 总共有 3105 列。大约有 13k（我认为？）行基因。我想要做的是获取每个基因（行）的平均数，并按唯一的列名称分组。所以最后我只有 2 列，Cell_A 和 Cell_B，以平均数（每个基因，即行）作为数据。

我希望它必须与 agg 或 groupby 做一些事情。但我不知道从哪里开始。如果您能提供一些指导，我将非常感激！

Answer 1

你是对的，你想按列分组并进行

mean

操作。

首先，保留第一列作为索引：

df = df.set_index(['Gene'])

那就做吧

df.groupby(by=df.columns, axis=1).mean()