尽管在这里阅读了很多页面,但我在弄清楚如何在 R 中对数据集进行子集化时遇到了很多麻烦。该集合包含来自 3000 多名参与者的信息。每个参与者被问及五种不同的健康状况,并给出二元答案(即是/否糖尿病;是/否肥胖等)。如何创建一个包含仅具有其中一种条件的人的子集?例如,这个新子集中的每个人都会患有肥胖症或糖尿病或高胆固醇,但没有人会患有两种或两种以上的疾病。
谢谢!!
ETA:经过一夜的睡眠,我再次查看了所有内容(以及评论)。这是一些澄清以及我此后所做的事情。
示例数据(mydata)(0 = 否,1 = 是)
Participant HighCho Diabetes Obesity
1 1 1 0
2 0 1 1
3 1 0 0
4 0 0 0
5 0 1 0
我希望我的子集结果仅包括那些没有这三个条件或仅包括这三个条件之一的结果:
Participant HighCho Diabetes Obesity
3 1 0 0
4 0 0 0
5 0 1 0
我写过:
new.data <- subset(mydata = (HighCho == 0 & Diabetes == 0 & Obesity==0) | HighCho == 1 | Diabetes == 1 | Obesity == 1)
我的问题是,即使我捕获了所有没有任何病症的人,但我仍然包括患有多种病症的人。我认为用我的“或”陈述,我只会包括那些只有三个条件之一(而不是两个)的人。关于我可能做错了什么有什么见解吗?
'%.ist'alhmt cepnot ayen tue iCyb b
o1'abhdadaaoer t1'pms]oi, aptt' e itpnui,sesi
([n H at dnDYsrmysta[fycc]h es,i%nl) ,t oim
,ancu :ohgmpey 'Oha ,i(uf0cpuonhuc
)a