在多个熊猫数据帧中设置了相同的索引?

问题描述 投票:0回答:1
在某些项目中,我正在使用数据库,其中有多个有关相同类型类型的数据来源,从某种意义上说,我希望一个过程的输出(例如数据库查询)是具有相同数据的数据框架我期望的是许多其他过程的输出。在这种情况下,我经常对这些对象上的索引有很大的假设,例如应该对它们进行分类,独特或两者兼而有之。

但是,如果我在每种情况下设置/检查/确定预期的索引属性,我最终都会得到很多样板代码。没有某种方法可以将索引集中定义为模块常数,然后将其导入并将其应用于胁迫/验证每个关注的数据框架以具有预期的索引?

pandas dataframe indexing schema
1个回答
0
投票
I是

indexes.index(在pandahandler软件包中)的作者,简化了声明数据框架索引的过程。用户可以将索引定义为在任何特定于产品的生态系统中替换索引设置/检查样板的常数。 ,例如,您可以定义“猫索引”,然后将其应用于任何数据框架,仅通过在框架上调用索引来应用于任何数据框架:

from pandahandler.indexes import Index CATS_INDEX = Index(["cats"], sort=True) df = pd.DataFrame( { "cats": ["siamese", "little", "persian"], "timestamp": ["2021-01-01", "2021-01-02", None], }, index=pd.RangeIndex(3, name="idcol"), ) index_df = CATS_INDEX(df)

由此产生的数据框架具有各种不错的工作:

现在指定的索引列是
    "cats"
  • 数据是根据索引(自
    sort=True
  • 对数据进行排序的。
    索引一定是独一无二的,没有零值(我们可以避免用
    require_unique=False
  • allow_null=True
    做出这样的断言)。
    
    	
最新问题
© www.soinside.com 2019 - 2025. All rights reserved.