我有一个熊猫DataFrame。假设我想对每个小组的两个人进行抽样,我使用以下代码来获取新的数据框:
sample_df = df.groupby("category").apply(lambda group_df: group_df.sample(2, random_state=1234)
我想创建一个存储未采样人员的数据框。
sample_df
stil具有原始df
的索引,所以我可能必须对此进行处理,但是我不确定是什么...
提前感谢!
首先将group_keys=False
添加到groupby
,以避免category
到MultiIndex
: