我有两个不同年份收集的横截面数据集,每个数据集检查不同的样本。每年,我们都会评估参与者的人体测量数据以及有关饮食和运动习惯的信息。
现在,我想将这些横截面数据集转换为时间序列数据。然而,两个数据集中的样本并不相同。例如,我们没有特定个体随时间变化的身高。相反,我想在数据集 2 中找到与数据集 1 中的样本最相似的人。
这种方法科学有效吗? 如果是这样,我可以使用哪些方法或技术来查找数据集中最相似的个体?
是的,您的方法对于比较一段时间内的横截面数据是有效的,但您是在比较不同的个体,而不是跟踪相同的个体。您可以使用以下技术:
但是,请注意局限性,例如缺乏真正的时间连续性和匹配偏差的可能性。