如何将横截面数据转换为非相同样本的时间序列数据

问题描述 投票:0回答:1

我有两个不同年份收集的横截面数据集,每个数据集检查不同的样本。每年,我们都会评估参与者的人体测量数据以及有关饮食和运动习惯的信息。

现在,我想将这些横截面数据集转换为时间序列数据。然而,两个数据集中的样本并不相同。例如,我们没有特定个体随时间变化的身高。相反,我想在数据集 2 中找到与数据集 1 中的样本最相似的人。

这种方法科学有效吗? 如果是这样,我可以使用哪些方法或技术来查找数据集中最相似的个体?

time-series data-science similarity
1个回答
0
投票

是的,您的方法对于比较一段时间内的横截面数据是有效的,但您是在比较不同的个体,而不是跟踪相同的个体。您可以使用以下技术:

  1. 倾向得分匹配(PSM):根据共同特征在数据集中找到相似的个体。
  2. 基于距离的指标(例如,欧几里德距离或余弦相似度):计算数据集中个体之间的相似度。
  3. K-最近邻(K-NN):识别个体之间最接近的匹配。

但是,请注意局限性,例如缺乏真正的时间连续性和匹配偏差的可能性。

© www.soinside.com 2019 - 2024. All rights reserved.