如何根据每个参与者的最早时间点过滤数据集?

问题描述 投票:0回答:0
为了扩展我在标题中所说的内容,我在Excel中有一个数据集,其中包含患者ID,抽血时间以及其他相应的价值(例如疾病诊断等)。

我想做的是使用

R

最早的血液抽血时间过滤患者,但是由于同一患者多年来反复采样,因此有重复。请参阅下面的示例:

记录ID策划ID血液抽血经验价值6131000011/4/154094.36131000011/4/16394.26131000011/4/174949.26781000294/4/13494.36781000294/4/14293.27891004505/7/1734932.37891004505/10/18394.37891004505/10/2039493.37891004509/8/21895.47891004501/20/235883.57891004501/1/25495.379010089/10/184959.379010085/10/204959.88011000789/8/21695.69001000828/20/236979.79001000821/1/257000有许多更多类型的数据(数值和分类)数据的列,但我真正关心的只是在最早的血液抽血日期之前过滤数据集。
truth可以告诉我,我不知道从哪里开始。我一直在寻找stackoverflow上的包裹和相关问题,以查看其他人是否有类似的经历,但到目前为止没有运气。我确实找到了一个名为
R

的包裹,但我仍然对它的细节感到困惑。 我希望最终结果看起来像这样:


记录ID

策划ID

血液抽血
经验价值6131000011/4/154094.36781000294/4/13494.37891004505/7/1734932.379010089/10/184959.38011000789/8/21695.69001000828/20/237000没有真正的押韵或吸血日期的理由,尤其是因为我使用的数据集已建立并添加到十多年或更长时间以上。因此,如果有人知道某事或有一些建议,我会非常感谢! 您可以尝试这样的事情(但是我声明的数据代替了您的数据)。
admiral
r excel database
最新问题
© www.soinside.com 2019 - 2025. All rights reserved.