我有以下用于情感分类的用例(玩具/示例,而不是实际用例)。我有一些受访者 (
userid
),他们会随机写一些 comments
来表达他/她的感受。目标是根据评论对情绪(积极/消极)进行分类,并查看模式是走向积极还是消极。
userid| time | comment
1 | jan 1, 11:00 am | cccccsccscccscsc
1 | jan 1, 3:00 pm | dddddddddddd
1 | jan 2, 10.00 am | cccccsccscccscsc
1 | jan 2, 5:00 pm | dddddddddddd
2 | jan 1, 11.00 am | cccccsccscccscsc
2 | jan 1, 3:00 pm | dddddddddddd
2 | jan 1, 11.00 pm | ccccssssssc
2 | jan 2, 9:00 am | dddddddddddd
2 | jan 2, 3:00 pm | dddddddddddd
2 | jan 3, 10.00 am | ccccssssssc
2 | jan 3, 2:00 pm | dddddddddddd
2 | jan 3, 5.00 pm | cccccsccscccscsc
2 | jan 3, 9:00 pm | dddddddddddd
情感分类算法可以解决这个问题,但它不会考虑时间序列。这些算法将考虑每一行独立于其他行。 我正在探索是否存在任何方法/代码来解决此类问题。在这里,我们想要按顺序查看 NLP 文本的序列,并确定情绪是正面还是负面。
我建议看一下本文中介绍的关于将时间转换为向量(Time2vec)的方法。时间向量是从与输入评论相对应的时间戳T(t)中学习的。一旦获得与单列相关的表示,您就可以将表示与时间向量(特定于该评论)相加,并通过输出线性层处理它们以学习情感类别/评级。