我在 R 中遇到问题,我的数据集有不同级别的不同因素。 例如,一个是 ID,另一个是观察年份,如下所示:
身份证 | 年 |
---|---|
6 | 2015 |
6 | 2015 |
6 | 2015 |
6 | 2015 |
6 | 2018 |
6 | 2018 |
6 | 2018 |
6 | 2018 |
6 | 2018 |
7 | 2015 |
7 | 2015 |
7 | 2015 |
7 | 2015 |
7 | 2015 |
8 | 2015 |
8 | 2015 |
8 | 2015 |
8 | 2021 |
8 | 2021 |
我想知道ID是否(以及哪些)在不同年份有观察结果。在上面的示例中,我在 2015 年和 2018 年进行了 ID 6 观察,在 2015 年和 2021 年进行了 ID 8 观察。
我确信我能够用循环解决这个问题,但我可以想象,有一种更简单的可能性可以做到这一点。我宁愿留在 R 基地而不使用软件包。
aggregate
可以帮助
> aggregate(. ~ ID, df, unique)
ID year
1 6 2015, 2018
2 7 2015
3 8 2015, 2021