多索引(也称为分层索引)允许在二维表格结构中操纵更高维数据。
数据帧列表(例如 dfs = [df1, df2, ...]) 所有数据框列都是多索引(例如[("something", "id",), ("something", "age"), ...]) 我想设置&q...
假设我们有一个 DataFrame: 数据= {'person_id':['person_a','person_a','person_b','person_b','person_c','person_c'], 'categorical_data': ['新', '新', '好', '坏', '新', '坏']} df =...
如果我构建一个像这样的数据框 数组 = [ np.array(["bar", "bar", "baz", "baz", "foo", "foo", "qux", "qux"]), ...
pandas MultiIndex 是 SQL 复合索引的对应项吗?
我几天前在reddit上发布了这个,但没有收到任何回复。 我在网上读到的有关 pandas MultiIndex 的所有内容都使它看起来像是 SQL 复合索引的对应项。这是……
我有以下带有 MultiIndex 列的 DataFrame(这同样适用于 MultiIndex 行): 将 pandas 导入为 pd df = pd.DataFrame(columns=pd.MultiIndex.from_product([['A','B'],[1,2,3,4]])...
来自嵌套字典列表的 pandas 多索引 DataFrame
我有一个嵌套字典列表 lst = [{'a':{'aa':1, 'ab':2}, 'b':{'ba':3, 'bb':4}}] * 2 我正在努力获取带有多索引列的 pandas DataFrame。 目前我正在做: pd.concat([ ...
我正在努力创建这个数据框 甲乙 坐标 1 2 1 2 6 3 c 2 7 2 从这两个词典看来就足够了: 数据 = {'A': [2,6,7], 'B': [1,3,2]} ...
如何删除<indexing past lexsort depth may impact performance?">
我有一个具有非唯一多重索引的数据框: 甲乙 L1 L2 7.0 7.0 -0.4 -0.1 8.0 5.0 -2.1 1.6 5.0 8.0 -1.8 -0.8 7.0 7.0 0.5 -1.2 南 -1.1 -0.9 5.0 8.0 0.6 2.3 我想要...
为什么带有 dropna=False 的 groupby 会阻止后续的 MultiIndex.dropna() 工作?
我的理解是MultiIndex.dropna()删除至少一级为NaN的索引条目,没有条件。然而,如果之前的 groupby 与 dropna=False 一起使用,则似乎不是
拥有3个级别(年、月、日)的多索引数据框,我想保留每个月的最后一天,在下面的情况下,2024年4月,只应保留第4天
在 MultiIndex 数据帧上对 df.sort_index() 的调用中,如何将 func_2 用于第二级? func_1 = lambda s: s.str.lower() func_2 = lambda x: np.abs(x) m_sorted = df_multi.sort_index(level=['one'...
我有两个多索引的 pandas 数据框,如下所示: >>> df1 = pd.DataFrame({ ... ('y1', '0'): [1, 2, 3], ... ('y2', '0'): [4, 5, 6], ... ('y11', '0'): [7, 8, 9], ......
我有一个多索引列数据框,也有日期。我希望将列作为行。 例如: |一个 |一个 |乙|乙| | X |是 | X |是 |日期 | | 1 | 2 | 3 | 4 | 08 年 5 月 | 我需要它...
假设我有一个带有多个索引的 Pandas 数据框: 数组= [[“英国”,“英国”,“美国”,“法国”],[“公司1”,“公司1”,“公司2”,“公司...
在 pandas df 中添加一个空列,其多索引与现有列相邻会创建重复项
我正在尝试协调两个数据帧的结构。 它们具有相同的列,除了其中一个已对其执行 df.compare() 的数据帧,因此它是带有“self”的多索引...
在pandas中,如何在两列加值列的枢轴期间或之后可靠地设置多级列的索引顺序
围绕具有单独值列的两列进行旋转后,我想要一个具有特定顺序的多索引列的 df,如下所示(请忽略 multi-2 和 multi-3 标签在
我有一个如下所示的带有多索引的数据框 mx_dict = pd.read_excel('ABC Bookings.xlsx', header=[1,2],sheet_name=None) Excel 文件(如果有用):Excel 文件 mx = pd.concat(mx_dict.values(),...
我们从以下数据开始: 将 numpy 导入为 np 将 pandas 导入为 pd 数据=pd.DataFrame(数据=np.random.rand(10,5),列=['headA','headB','tailA','tailB','tailC']) 现在我想执行某个 unstack
这是一个最小的例子: 将 pandas 导入为 pd 将 numpy 导入为 np idx = pd.MultiIndex.from_product([[1,2,3], ['a', 'b', 'c'], [6, 7]]) df = pd.DataFrame(np.random.randn(18),index=idx) 选择=...
假设我有3个数据框, df_1 代表收入 年份 TSLA MSFT AVY 2019 851 200 112.8 2018 725 150 92.6 df_2 代表一些其他收入 是啊...