所以我有一个这样的数据框
customer location trip_len
0 a ['1', '2', '3'] 3
1 b ['4', '5'] 2
[我正在尝试为“位置”列的字符串列表中的每一行散列每个元素,以提高模型的效率。这怎么可能?
列表不是本地可哈希的,因为它们是可变对象。如果只需要存储,则可以选择转换为tuple
。
df.location = df.location.apply(lambda locations: hash(tuple(locations)))