熊猫如何切割多索引Dataframe？

Question

           name                     address             contact_info    
        first_name  last_name       stret   city    mobile      email
    1   AAA             BBB         XXX     YYY     02020       [email protected]
    2   111             222         333     444     239393      [email protected]

我有以上格式的擅长。我想要的是将每个列都放在名称内，然后只有联系信息中的移动列，有人请告诉我如何做到这一点。以下代码为我提供了名称和contact_info内的所有内容

import pandas as pd
df = pd.read_excel("test.xlsx", header=[0, 1], sheet_name="Mapping")
print df[["name", "contact_info"]]

我想要得到这样的东西，

first_name  last_name   mobile
AAA         BBB        102020
111         222        239393

Answer 1

不确定为什么你要避免concat，但这样做：

df = pd.read_excel("multi-index-test.xlsx", header=[0, 1], sheet_name="Mapping")
df.drop('address', level=0, axis=1).drop('e-mail', level=1, axis=1)

这利用了MultiIndex.drop()。

Answer 2

你可以在这里使用df.xs：

i = df.xs('name', axis=1)
j = df.xs('mobile', axis=1, level=-1)

pd.concat([i, j], axis=1)

  first_name last_name  contact_info
1        AAA       BBB          2020
2        111       222        239393

Answer 3

通过使用IndexSlice + concat

idx = pd.IndexSlice
pd.concat([df.loc[:, idx['name',:]],df.loc[:,idx[:,'mobile']]])
Out[104]: 
   contact_info       name          
         mobile first_name last_name
1           NaN        AAA       BBB
2           NaN        111       222
1          2020        NaN       NaN
2        239393        NaN       NaN

Answer 4

选项1 最简单的我能想到的是列切片：

df['name'].join(df['contact_info']['mobile'])

  first_name last_name  mobile
1        AAA       BBB  020202
2        111       222  239393

选项2 pd.DataFrame.filter

df.filter(regex='name|mobile')

        name           contact_info
  first_name last_name       mobile
1        AAA       BBB       020202
2        111       222       239393

我们可以降低水平

d = df.filter(regex='name|mobile')
d.columns = d.columns.droplevel(0)
d

  first_name last_name  mobile
1        AAA       BBB  020202
2        111       222  239393

Answer 5

您正在寻找的只需要basic indexing on a multiindex和concat。这是一个例子：

df = pd.read_excel("multi-index-test.xlsx", header=[0, 1])
df1 = df[["name"]]
df2 = df['contact_info', 'mobile']
pd.concat([df1, df2], axis=1)

我相信这个解决方案的好处是1）简单和2）一般。

熊猫如何切割多索引Dataframe？

问题描述投票：1回答：5

5个回答

最新问题

熊猫如何切割多索引Dataframe？

问题描述 投票：1回答：5

5个回答

最新问题

问题描述投票：1回答：5