为了扩展我在标题中所说的内容,我在Excel中有一个数据集,其中包含患者ID,抽血时间以及其他相应的价值(例如疾病诊断等)。
我想做的是使用
R
最早的血液抽血时间过滤患者,但是由于同一患者多年来反复采样,因此有重复。请参阅下面的示例:
记录ID策划ID血液抽血经验价值6131000011/4/154094.36131000011/4/16394.26131000011/4/174949.26781000294/4/13494.36781000294/4/14293.27891004505/7/1734932.37891004505/10/18394.37891004505/10/2039493.37891004509/8/21895.47891004501/20/235883.57891004501/1/25495.379010089/10/184959.379010085/10/204959.88011000789/8/21695.69001000828/20/236979.79001000821/1/257000有许多更多类型的数据(数值和分类)数据的列,但我真正关心的只是在最早的血液抽血日期之前过滤数据集。
truth可以告诉我,我不知道从哪里开始。我一直在寻找stackoverflow上的包裹和相关问题,以查看其他人是否有类似的经历,但到目前为止没有运气。我确实找到了一个名为
R
的包裹,但我仍然对它的细节感到困惑。
我希望最终结果看起来像这样:
记录ID
策划ID
血液抽血
经验价值6131000011/4/154094.36781000294/4/13494.37891004505/7/1734932.379010089/10/184959.38011000789/8/21695.69001000828/20/237000没有真正的押韵或吸血日期的理由,尤其是因为我使用的数据集已建立并添加到十多年或更长时间以上。因此,如果有人知道某事或有一些建议,我会非常感谢!
您可以尝试这样的事情(但是我声明的数据代替了您的数据)。