pytorch 相关问题

PyTorch是一个深度学习框架,它实现了一个动态计算图,它允许您改变神经网络在运行中的行为方式,并能够执行向后自动区分。

batch_first

我还是不明白PyTorch LSTM中的batch_first。我尝试了有人提到我的代码,当batch_first = False时,它适用于我的火车数据,它产生相同的输出......

回答 1 投票 0

在 pytorch 中获取预训练 Transformer 的注意力分数

当我传入特定数据时,我一直在尝试查看预训练 Transformer 的注意力分数。它具体是一个 Pytorch Transformer。我尝试过使用前向钩子,但我只能......

回答 1 投票 0

PyTorch 中多元时间序列预测的 LSTM 模型中的验证损失和提前停止

我正在尝试训练 LSTM 模型来预测油价,遵循一些教程。 我的数据集: 日期 美元指数 石油价格 2019年10月12日 50 66 2019年10月13日 51 60 其中石油价格是目标值...

回答 1 投票 0

多GPU训练中的损失函数

我使用 Pytorch 和 BERT 来训练模型。 Everithing 在一个 GPU 上工作得很好,但是当我尝试使用多个 GPU 时,我收到一个错误: ValueError Traceback(最新...

回答 1 投票 0

如何让`__getitems__`返回一个字典?

在torch的Dataset中,除了必需的__getitem__方法之外,您还可以实现__getitems__方法。 在我的例子中 __getitem__ 返回一个字典,但我不知道如何用

回答 1 投票 0

使用或不使用批次实现相同的训练

我在 PyTorch 中有一个模型,在使用标准训练过程时,它可以很好地收敛于参考示例,其中优化器同时对所有样本进行训练: 损失 = loss_fnc(样本) 莫...

回答 1 投票 0

如何在 MacOS 上使用 js-pytorch 和 clojurescript?

使用 js-pytorch 和 clojurescript 失败。请评论如何使用clojurescript修复js-pytorch的安装问题 在 calva-repl 中执行: (ns服务器.ros2 (:需要["js-py...

回答 1 投票 0

为什么我的 LSTM 无法确定序列的个数是奇数还是偶数?

我正在尝试理解 LSTM,并想实现一个简单的示例,如果序列中“1”的数量是奇数,则将序列分类为“0”,如果

回答 1 投票 0

如何从有限列表中传递元素作为输入?

我有“石头剪刀布”游戏的状态列表。 我计划对这些类别进行编码,如下所示: [1, 0, 0] - 摇滚 [0, 1, 0] - 纸 [0, 0, 1] - 剪刀 有转换吗...

回答 1 投票 0

Anaconda 更新时总是想把我的 GPU Pytorch 版本替换为 CPU Pytorch 版本

我有一个新安装的Anaconda3(版本2020.02)环境,并且通过命令 conda install pytorch torchvision cudatoolkit=10.2 -c pytorch 安装了Pytorch GPU版本。我已经验证了...

回答 3 投票 0

libtorch/Pytorch:用 C++ 从 Tensor 中切片通道

我有一个用于分割任务的神经网络,它产生形状为 [1, 2, 416, 416] 的输出张量。第一个索引是批量大小,第二个索引是输出通道。我可以摆脱

回答 1 投票 0

C++ 中的 PyTorch - 如何获取所有维度的张量的一部分?

我在Python中有以下张量运算: A = A[ :, h_offset:h_offset + 细尺寸, w_offset:w_offset + 细尺寸 ] 其中 *_offset 和fineSize 是一些整数。我是...

回答 1 投票 0

在 macbook 上使用 MPS 训练 yolov8

我正在尝试通过以下代码在我的自定义数据集上训练 yolov8: 模型 = YOLO('yolov8s.pt') # 火车 结果=模型.train( 数据=数据, 纪元=纪元, 批次=批次大小, imgsz=

回答 1 投票 0

PyTorch:保存优化器状态的目的是什么?

PyTorch 能够保存和加载优化器的状态。 PyTorch 教程中显示了一个示例。我目前只是保存和加载模型状态,而不是优化器。那又怎样...

回答 2 投票 0

如何在PyTorch中完成多维花式索引?

我有一个 3D 张量([batch_size,seq_length,hidden_dim])和一个 2D 列表([batch_size,seq_length])。 我想使用列表来完成这个张量的选择。 例如:3D十的形状...

回答 2 投票 0

在训练循环内将requires_grad设置为False后,如何立即为True,而不是在外部?

我正在尝试使用torchrl的ClipPPOLoss在多智能体强化学习环境中训练多个智能体。由于某种原因,这个损失模块不想接收样本日志

回答 1 投票 0

torch.autograd.grad 在计算时间导数时返回“None”

我有一个 LSTM 模型,它采用 3 个温度数据序列并输出下一个序列。 输入=> [数组([0.20408163, 0.40816327, 0.6122449 ]), 数组([0.40816327, 0.6122449, 0.

回答 1 投票 0

如何实现SwiGLU激活?为什么 SwiGLU 接受两个张量?

https://arxiv.org/pdf/2002.05202 中引入的 SwiGLU 变体简直就是“神圣的仁慈”,而 Flash-Attention 的实现则开箱即用 https://github.com/Dao...

回答 1 投票 0

如何用未知的值和大小裁剪张量的常量值填充(填充高度和宽度相同)?

如何用未知的值和大小裁剪张量的常量值填充(填充高度和宽度相同)? 我认为因为张量周围的填充有一个缺点......

回答 2 投票 0

为什么我的 torchserve docker 镜像无法在 google cloud run 上运行?

我有这个泊坞窗图像: # 语法 = docker/dockerfile:1.2 来自 Continuumio/miniconda3 # 安装操作系统依赖项 运行 mkdir -p /usr/share/man/man1 运行 apt-get update && \ DEBIAN_FRONTEND=

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.