Pandas-根据行值生成唯一ID

问题描述 投票:0回答:3

我想为用户生成一个基于整数的唯一ID(在我的df中。)>

假设我有:

index  first  last    dob
0      peter  jones   20000101
1      john   doe     19870105
2      adam   smith   19441212
3      john   doe     19870105
4      jenny  fast    19640822

我想生成一个ID列,如下所示:

index  first  last    dob       id
0      peter  jones   20000101  1244821450
1      john   doe     19870105  1742118427
2      adam   smith   19441212  1841181386
3      john   doe     19870105  1742118427
4      jenny  fast    19640822  1687411973

10位数字的ID,但它基于字段的值(john doe相同的行值获得相同的ID)。

我已经研究了散列,加密和UUID,但找不到与此特定的非安全用例有很大关系。这只是生成一个内部标识符。

  • 我不能使用groupby / cat代码类型的方法,行更改。
  • 数据集不会超过5万行。
  • 可以确定不会出现第一个,最后一个,重复的Dob。
  • 感觉好像我可能以错误的方式来解决这个问题,因为我找不到很多文献!

谢谢

我想为用户生成一个基于整数的唯一ID(在我的df中)。假设我有:index first last dob 0 peter jones 20000101 1 john doe 19870105 2 adam ...

python pandas hash
3个回答
0
投票

这是使用numpy的一种方式


0
投票

您可以尝试使用哈希函数。


0
投票

您可以在数据框列上应用以下功能。

© www.soinside.com 2019 - 2024. All rights reserved.