如何使用groupby将每个组与前一个重叠组分组？

Question

我的数据框：

import pandas as pd

df = pd.DataFrame(
    {
        'a': list('xxxxxxxxxxyyyyyyyyy'),
        'b': list('1111222333112233444')
    }
)

预期输出是组列表：

逻辑：

分组从

df.groupby(['a', 'b'])

开始，然后我想将每个组与其前一个组连接起来，这给了我预期的输出。

也许我提到的最初分组是没有必要的。

请注意，在预期输出中，

列不能同时包含

和

。

老实说，重叠行并不是我在使用

groupby

时所做的事情。所以我不知道如何尝试去做。我尝试过

df.b.diff()

，但还差得远。

Answer 1

您可以组合

groupby

、

itertools.pairwise

和

concat

：

from itertools import pairwise

out = [pd.concat([a[1], b[1]]) for a, b in pairwise(df.groupby(['a', 'b']))]

输出：

如何使用groupby将每个组与前一个重叠组分组？

问题描述投票：0回答：1

1个回答

最新问题

如何使用groupby将每个组与前一个重叠组分组？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1