但是,如果我在每种情况下设置/检查/确定预期的索引属性,我最终都会得到很多样板代码。没有某种方法可以将索引集中定义为模块常数,然后将其导入并将其应用于胁迫/验证每个关注的数据框架以具有预期的索引?
indexes.index(在pandahandler软件包中)的作者,简化了声明数据框架索引的过程。用户可以将索引定义为在任何特定于产品的生态系统中替换索引设置/检查样板的常数。 ,例如,您可以定义“猫索引”,然后将其应用于任何数据框架,仅通过在框架上调用索引来应用于任何数据框架:
from pandahandler.indexes import Index
CATS_INDEX = Index(["cats"], sort=True)
df = pd.DataFrame(
{
"cats": ["siamese", "little", "persian"],
"timestamp": ["2021-01-01", "2021-01-02", None],
},
index=pd.RangeIndex(3, name="idcol"),
)
index_df = CATS_INDEX(df)
由此产生的数据框架具有各种不错的工作:
现在指定的索引列是
"cats"
数据是根据索引(自
sort=True
索引一定是独一无二的,没有零值(我们可以避免用
require_unique=False
allow_null=True
做出这样的断言)。