长期短期记忆。一种神经网络架构,包含可以记住任意时间长度值的循环NN块。深度NN非常受欢迎的构建块。
我目前有一个具有多个特征的数据集,其中每一行都是一个时间序列,每一列都是一个时间步。例如: 我应该如何重新调整数据以便我可以正确地表示
类似 Tensorflow RNN 的神经网络不会像 Mac M1 上那样进行训练
我正在Tensorflow官网上学习python深度学习工具。 尝试构建几个文本分类网络,按照教程进行。但 LSTM 不能正常工作。 将 numpy 导入为 np ...
我正在尝试弄清楚 PyTorch LSTM 如何获取输入。我已阅读文档,但我希望有更有经验的人来确认或更正我迄今为止收集到的内容。 首先,让我们建立
X = [] Y = [] 对于文档中的行: 单词 = line.split() line_length = len(字数) if line_length > 1: # 排除 1 个单词或更少的行 input_sequence = [word_to_index.get(w...
我正在尝试在 google colab 中为我的 NLP 项目“导入缩写”,但它不起作用。 我的问题的原因是什么以及解决方案
我一直在研究用于时间序列预测的多元 LSTM 模型,但遇到了一个问题,即预测输出没有表现出足够的可变性或“起伏”。预...
如何让训练有素的 LSTM 预测了解即将发生的已知特殊事件?
我根据每日销售数据训练了 LSTM 模型,包括对销售影响很大的假期和特殊活动(作为二进制指标)。但是,当模型在测试集之外进行预测时,它......
我想训练AI,但是遇到了squeeze dim的错误,怎么解决?
我正在研究 LSTM 神经网络编码,如下所示: hist = model.fit(训练, 标签,batch_size=16, epochs=1000) 但它遇到了一个错误: ValueError:无法挤压暗淡[1],预计尺寸为...
Bert 编码器接受输入并进入多头注意力模型。但它们如何保持顺序呢?由于当前单词不采用先前单词的顺序。另外,为什么是双向的...
模块“keras.api._v2.keras.layers”没有属性“LSTMStateTuple”
运行 LSTM 模型时,我陷入了这段代码 - # 创建单元状态和隐藏状态变量来维护 LSTM 的状态 c、h = []、[] 初始状态 = [] 对于范围内的 li(n_layers): ...
我正在使用 LSTM 解决时间序列预测问题。 输入包含多个特征,因此我使用多元 LSTM。 问题是有一些缺失值,例如......
在多元时间预测 LSTM 模型中预测未来值,该模型根据之前的数据预测未来 10 天的价格
我对如何使用时间序列多元 LSTM 模型预测未来结果感到困惑。 我正在尝试建立一个股票市场预测模型,并且我有以下数据特征 日期高...
LSTM TypeError:估计器应该是实现“fit”方法的估计器,
我已经构建了 LSTM 模型,但我仍然看不到 y 变量的特征重要性。我可能会出现如下错误,允许我尝试更改环境。 有人可以吗...
我想了解有关使用双向 LSTM 进行序列分类时的合并模式的更多详细信息,特别是对于“Concat”合并模式,目前还不太清楚...
训练与验证曲线 - 训练损失和验证损失正在收敛,但损失接近 0 我预计验证损失应该大于训练损失 我做到了...
训练与验证曲线训练损失和验证损失正在收敛,但损失接近 0 我预计验证损失应该大于训练损失 我没有...
训练和验证曲线 - 是过度拟合还是拟合良好? (我正在使用 LSTM 进行时间序列预测项目)
训练与验证曲线训练损失和验证损失正在收敛,但损失接近 0 我预计验证损失应该大于训练损失 我没有...
使用目标数据中的缺失值训练 LSTM 神经网络 - 错误 optim.step()
我想用目标数据中的缺失值和用户定义的损失函数来训练 LSTM 神经网络。然而,optim.step()之后出现错误,一些权重/偏差是nan。是
解决调用层“tf.keras.backend.rnn_1”时的 Keras TypeError 限制
我正在尝试使用 Keras 在使用 LSTM 网络的机器翻译中使用注意力机制。 但是,我在代码中遇到 TypeError 异常。 TypeError:调用时遇到异常
使用 model.evaluate 和 model.predict 评估测试数据上的模型性能时的不同结果
我对 Keras 中的 model.evaluate() 和 model.predict() 函数有疑问。我在 Keras 中构建了一个简单的 LSTM 模型,并想在测试数据集上测试模型性能。我考虑过