创建随机整数和跨列有限和大熊猫数据帧

问题描述 投票:3回答:2
df = pd.DataFrame(np.random.randint(0,6,size=(1200000, 3)), 
columns=list('ABC'))
df['sum'] = df[['A','B','C']].sum(axis=1)
df = df[df['sum']==5]
df = df.sample(n=100000)

我想在0和5之间建立包含三个不同列的数据帧与随机数,使得跨越之列5。

python-3.x pandas numpy random
2个回答
2
投票

您可以使用itertools排列找到与相加等于0和5之间的数到5,然后将结果以数据帧

import itertools
df = pd.DataFrame([elem for elem in list(itertools.permutations(range(6), 3)) if sum(elem) == 5], columns = list('ABC'))
df['sum'] = df.sum(1)

    A   B   C   sum
0   0   1   4   5
1   0   2   3   5
2   0   3   2   5
3   0   4   1   5
4   1   0   4   5
5   1   4   0   5
6   2   0   3   5
7   2   3   0   5
8   3   0   2   5
9   3   2   0   5
10  4   0   1   5
11  4   1   0   5

0
投票

你可以用np.random.multinomial检查

np.random.multinomial(5, [1/3.]*3, size=5) # here when you input size 5 , it only creat 5 lines
Out[38]: 
array([[2, 2, 1],
       [1, 2, 2],
       [0, 3, 2],
       [1, 1, 3],
       [3, 1, 1]])

完成数据帧

ary=np.random.multinomial(5, [1/3.]*3, size=5)

df=pd.DataFrame(ary,columns=['A','B','C'])
df['SUM']=df.sum(1)
df
Out[43]: 
   A  B  C  SUM
0  1  2  2    5
1  2  2  1    5
2  1  3  1    5
3  1  1  3    5
4  1  2  2    5
© www.soinside.com 2019 - 2024. All rights reserved.