我想为用户生成一个基于整数的唯一ID(在我的df中。)>
假设我有:
index first last dob 0 peter jones 20000101 1 john doe 19870105 2 adam smith 19441212 3 john doe 19870105 4 jenny fast 19640822
我想生成一个ID列,如下所示:
index first last dob id 0 peter jones 20000101 1244821450 1 john doe 19870105 1742118427 2 adam smith 19441212 1841181386 3 john doe 19870105 1742118427 4 jenny fast 19640822 1687411973
10位数字的ID,但它基于字段的值(john doe相同的行值获得相同的ID)。
我已经研究了散列,加密和UUID,但找不到与此特定的非安全用例有很大关系。这只是生成一个内部标识符。
感觉好像我可能以错误的方式来解决这个问题,因为我找不到很多文献!
谢谢
我想为用户生成一个基于整数的唯一ID(在我的df中)。假设我有:index first last dob 0 peter jones 20000101 1 john doe 19870105 2 adam ...
这是使用numpy的一种方式
您可以尝试使用哈希函数。
您可以在数据框列上应用以下功能。