我有一个很大的“时间序列”数据集,看起来像这样:
Date Day of the week Days Since last Happy Out of town Happy
1/1/20 Monday 0 1 1
1/2/20 Tuesday 1 0 0
1/3/20 Wednesday 2 0 0
1/4/20 Thursday 0 0 1
我想根据以前的观察结果预测未来几天的“快乐”观察结果。我凭直觉知道这些输入变量之间有相关性(例如星期几,自上次快乐观察以来的天数等),但我想知道这些输入变量与“快乐”观察的相关程度如何。
我应该使用哪种建模技术?泊西顿?马尔可夫链?线性回归?
如果您想了解变量之间的相关性,则可以使用DataFrame.corr(method='pearson')
获得相关性矩阵。