如何编写可与pandas方法链接一起使用的python函数

问题描述 投票:0回答:1

这是我最初的方法:

In [91]: def f(dataframe,col):
    ...:     dataframe[col] = dataframe[col]*0

但是以下操作失败:

In [90]: df=pd.DataFrame({'a':[1,2],'b':[4,5]})

In [91]: def f(dataframe,col):
    ...:     dataframe[col] = dataframe[col]*0
    ...:

In [92]: df.f('a')
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-92-e1a104c6b712> in <module>
----> 1 df.f('a')

~/.virtualenvs/this-env/lib/python3.7/site-packages/pandas/core/generic.py in __getattr__(self, name)
   5177             if self._info_axis._can_hold_identifiers_and_holds_name(name):
   5178                 return self[name]
-> 5179             return object.__getattribute__(self, name)
   5180
   5181     def __setattr__(self, name, value):

AttributeError: 'DataFrame' object has no attribute 'f'

我以为这将被很好地记录下来,但是我在任何地方都无法举例。

python pandas function methods chaining
1个回答
2
投票

您试图做的事情叫做猴子补丁。您需要将函数编写为方法(它将self作为第一个参数),然后将该方法作为属性分配给pd.DataFrame class,而不是实例化的对象。

import pandas as pd

def f(self, col):
    self.loc[:, col] = self.loc[:, col] * 0
    return self

pd.DataFrame.f = f

df=pd.DataFrame({'a':[1,2],'b':[4,5]})
df.f('a')
# returns:
   a  b
0  0  4
1  0  5

请记住,您编写的方法将就地修改数据框。如果需要保留原始数据帧,请使用函数顶部的.copy

© www.soinside.com 2019 - 2024. All rights reserved.