我有这种格式的数据:
Category Session_ID Step_Name
A 100 1
A 100 2
A 200 1
A 200 1 <--
A 200 1 <--
A 200 2
B 300 1
B 300 1 <--
我需要删除步骤名称在每个Session_ID中的重复名称的重复值。例如,在ID = 200中,需要将三个“ 1”更改为一个“ 1”,因此最终数据如下所示:
Category Session_ID Step_Name
A 100 1
A 100 2
A 200 1
A 200 2
B 300 1
您应该使用distinct operator:
your_table
| distinct Category, Session_ID, Step_Name
然后您可以得到预期的输出,如下所示,它在我这边工作:
Category Session_ID Step_Name
A 100 1
A 100 2
A 200 1
A 200 2
B 300 1
对于注释中的问题,如果使用上述查询,则只有“ A 100 1”之类的记录才被视为一个实体,并且只有“ A 100”之类的2个或更多完全相同记录才被视为一个实体如果使用distinct,则“ 1”将仅保留1条记录。
并且如果还有另一个记录,例如“ B 100 1”,则两个记录“ A 100 1”和“ B 100 1”都将保留。