使用 pyiceberg 创建表时,列由带有属性 field_id 的 NestedField 表示。当基于时间戳或日期字段定义分区时,source_id 不是 field_id。
我创建了一个包含一堆列的表,并且仅当 source_id 是列的索引(索引从 1 开始)时分区才起作用。为什么会出现这种情况,field_id 有什么用?
分区适用于 source_id,因为它使用列的位置,而不是其 field_id。