使用隔离包的相异指数

问题描述 投票:0回答:1

我正在尝试使用隔离包计算一个国家中几所学校的差异指数。我的数据集目前如下所示:

# A tibble: 948 × 4
   ethnicity              school                 acyear    n
   <chr>                  <chr>                  <chr>   <dbl>
 1 White                  school 1               2010/11  3245
 2 Unknown/not applicable school 1               2010/11   675
 3 Other                  school 1               2010/11     5
 4 Mixed                  school 1               2010/11    50
 5 Black                  school 1               2010/11    40
 6 Asian                  school 1               2010/11    95
 7 White                  school 2               2010/11  5905
 8 Unknown/not applicable school 2               2010/11  1060
 9 Other                  school 2               2010/11    15
10 Mixed                  school 2               2010/11   115
# … with 938 more rows

我使用的命令与我用来计算互信息指数和泰尔熵指数的命令非常相似:

dissimilarity (data,
        group = 'ethnicity',
        unit = 'school',
        weight = 'n') 

但是,我收到以下错误:

Error in dissimilarity(acyear1, group = "ethnicity", unit = "school", weight = "n") : 
  The D index only allows two distinct groups 

我尝试计算种族的虚拟变量,但仍然遇到相同的错误。

有人可以帮助我吗?

谢谢你:)

r package indices entropy mutual-information
1个回答
0
投票

在这种情况下,相异指数计算失败,因为根据定义,该指数仅比较两个组(在文献中,这通常是黑白相异指数)。在您的数据中,您有 6 个不同的种族/民族群体,因此您可以 a) 计算种族/民族群体的每种可能组合的指数(例如,白人-黑人、白人-亚洲人、黑人-亚洲人等); b) 决定一个种族/民族用作参考群体,并将所有其他种族/民族类别折叠在一起(例如,白人-非白人,其中非白人=黑人+亚洲人+混血+其他+未知);或 c) 使用围绕多个种族/族裔群体设计的不同隔离指数。

© www.soinside.com 2019 - 2024. All rights reserved.