当我在带有pandas的Jupyter笔记本中使用数据帧时,我可以进行大量的批量操作,例如:
df_color_pallette.loc[df_color_pallette['foreground']=='red','foreground']='green'
将“前景”列中的每个条目从“红色”更改为“绿色”。但是,如果我想知道哪些条目被更改,或者甚至只知道了多少更改,我将不得不将列的副本保留为“之前”并将其与更改的列进行比较(是的,我做到了)。但这似乎非常低效,迫使至少2次通过数据。它们是否有任何具有该信息的熊猫钩/日志/旗帜?
你可以跟踪面具
mask = df_color_pallette['foreground'] == 'red'
df_color_pallette.loc[mask, 'foreground'] == 'green'
然后检查
mask.sum()
甚至再改变一下
df_color_pallette.loc[mask, 'foreground'] == 'beige'