我有一个成人数据集,有两列“薪水”和“教育”。它们都保存对象值,例如“>50k”和“Masters”。我想使用 groupby 来显示不同教育水平之间的薪资差异。我希望能够了解每个教育级别有多少人赚取 $x 和 $y(只有 2 个薪资选项。)
我已经尝试过了
grouped = adult.groupby(["salary"], ["education"])
grouped
但这给了我这个错误:
----> 2 grouped = adult.groupby(["salary"], ["education"])
3 grouped
TypeError: unhashable type: 'list'
谢谢!
您已将两个单独的列表传递给函数,而不是传递两个单独的列表,请尝试将“薪水”和“教育”分组到一个列表中
groupby([“学历”,“工资”])