Python Pandas group by iteration

问题描述 投票:0回答:1

我在for循环的帮助下迭代Python 3.6中的pandas数据框中的groupby列。这个问题是,如果我有大量数据,它会变慢。这是我的代码:

import pandas as pd
dataDict = {}
for metric, df_metric in frontendFrame.groupby('METRIC'): # Creates frames for each metric
    dataDict[metric] = df_metric.to_dict('records') # Converts dataframe to dictionary

frontendFrame是一个包含两列的数据框:VALUE和METRIC。我的最终目标基本上是创建一个字典,其中每个指标都有一个键,其中包含与之相关的所有数据。我现在应该可以使用lambda或map,但我无法使用多个参数。 frontendFrame.groupby('METRIC').apply(lambda x: print(x))

如何解决这个问题并使我的脚本更快?

python python-3.x pandas dataframe
1个回答
1
投票

如果你在groupby之后不需要任何计算,不要分组数据,你可以使用.loc来获得你需要的东西

s=frontendFrame.METRIC.unique()


frontendFrame.loc[frontendFrame.METRIC==s[0],]
最新问题
© www.soinside.com 2019 - 2024. All rights reserved.