我有一个看起来像这样的 pandas 数据框
import pandas as pd
data = {
"Race_ID": [1,1,1,2,2,2,2,2,3,3,3,4,4,5,5,5,5,5,5],
"Student_ID": [3,5,4,1,2,3,4,5,4,3,7,2,3,9,10,2,3,6,5],
"theta": [3,4,6,8,9,2,12,4,9,0,6,5,2,5,30,3,2,1,50]
}
df = pd.DataFrame(data)
我想通过以下方法创建一个新列
df['feature']
:对于每个Race_ID
,假设Student_ID
等于$i$,那么我们将特征定义为
$$\sum_{k= ot= i}\sum_{j ot= i,k} f(k,j,i), \ \ f(k,j,i):= rac{ heta_j+ heta_i}{ heta_i+ heta_j+ heta_