我正在尝试使用隔离包计算一个国家中几所学校的差异指数。我的数据集目前如下所示:
# A tibble: 948 × 4
ethnicity school acyear n
<chr> <chr> <chr> <dbl>
1 White school 1 2010/11 3245
2 Unknown/not applicable school 1 2010/11 675
3 Other school 1 2010/11 5
4 Mixed school 1 2010/11 50
5 Black school 1 2010/11 40
6 Asian school 1 2010/11 95
7 White school 2 2010/11 5905
8 Unknown/not applicable school 2 2010/11 1060
9 Other school 2 2010/11 15
10 Mixed school 2 2010/11 115
# … with 938 more rows
我使用的命令与我用来计算互信息指数和泰尔熵指数的命令非常相似:
dissimilarity (data,
group = 'ethnicity',
unit = 'school',
weight = 'n')
但是,我收到以下错误:
Error in dissimilarity(acyear1, group = "ethnicity", unit = "school", weight = "n") :
The D index only allows two distinct groups
我尝试计算种族的虚拟变量,但仍然遇到相同的错误。
有人可以帮助我吗?
谢谢你:)
在这种情况下,相异指数计算失败,因为根据定义,该指数仅比较两个组(在文献中,这通常是黑白相异指数)。在您的数据中,您有 6 个不同的种族/民族群体,因此您可以 a) 计算种族/民族群体的每种可能组合的指数(例如,白人-黑人、白人-亚洲人、黑人-亚洲人等); b) 决定一个种族/民族用作参考群体,并将所有其他种族/民族类别折叠在一起(例如,白人-非白人,其中非白人=黑人+亚洲人+混血+其他+未知);或 c) 使用围绕多个种族/族裔群体设计的不同隔离指数。