df.fillna('unknown',inplace=True)
我有一个数据帧df,其中一些属性是分类的,一些属于对象。使用上面的表达式,我试图用'unknown'填充这些列中的缺失值。但我得到了一个错误,同时这样说“未知”在分类数据列的类别中不存在。
我该怎么做?
使用DataFrame.select_dtypes
并遍历每个分类列,并使用add_categories
访问器上的.cat
方法将“unknown”添加为类别。
for col in df.select_dtypes('category'):
df[col].cat.add_categories('unknown', inplace=True)
df.fillna('unknown',inplace=True)