这是我最初的方法:
In [91]: def f(dataframe,col):
...: dataframe[col] = dataframe[col]*0
但是以下操作失败:
In [90]: df=pd.DataFrame({'a':[1,2],'b':[4,5]})
In [91]: def f(dataframe,col):
...: dataframe[col] = dataframe[col]*0
...:
In [92]: df.f('a')
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-92-e1a104c6b712> in <module>
----> 1 df.f('a')
~/.virtualenvs/this-env/lib/python3.7/site-packages/pandas/core/generic.py in __getattr__(self, name)
5177 if self._info_axis._can_hold_identifiers_and_holds_name(name):
5178 return self[name]
-> 5179 return object.__getattribute__(self, name)
5180
5181 def __setattr__(self, name, value):
AttributeError: 'DataFrame' object has no attribute 'f'
我以为这将被很好地记录下来,但是我在任何地方都无法举例。
您试图做的事情叫做猴子补丁。您需要将函数编写为方法(它将self
作为第一个参数),然后将该方法作为属性分配给pd.DataFrame
class,而不是实例化的对象。
import pandas as pd
def f(self, col):
self.loc[:, col] = self.loc[:, col] * 0
return self
pd.DataFrame.f = f
df=pd.DataFrame({'a':[1,2],'b':[4,5]})
df.f('a')
# returns:
a b
0 0 4
1 0 5
请记住,您编写的方法将就地修改数据框。如果需要保留原始数据帧,请使用函数顶部的.copy
。