PyTorch是一个深度学习框架,它实现了一个动态计算图,它允许您改变神经网络在运行中的行为方式,并能够执行向后自动区分。
有没有办法使用索引列表同时访问python中的nn.ModuleList的模块?
有没有办法使用索引列表来同时访问模块 python 中的 nn.ModuleList? 我正在使用 pytorch ModuleList,如下所述, Decision_modules = nn.ModuleList([nn....
如何将 2x3x3x3 矩阵乘以 2x3 矩阵得到 2x3 矩阵
我正在尝试计算神经网络输出的一些导数。准确地说,我需要由神经网络表示的函数的雅可比矩阵和
如何在 AWS Sagemaker ml.t3.2xlarge 实例中使用 GPU?
我在 AWS Sagemaker 上有一个笔记本 ml.t3.2xlarge 实例,我想使用 pytorch 训练神经网络。 以下命令返回“False”: torch.cuda.is_available() 有吗
如何计算处理 EOS 代币时拥抱脸部模型的教师强制准确率 (TFA)?
我正在尝试计算拥抱脸部模型的教师强制准确率(TFA),确保以下几点: EOS 代币处理:模型应该因预测第一个 EOS 代币而获得奖励。 忽略
完整项目可在 https://github.com/mwp-g/MWPG-DMR 获取 输出 代码 我在网上搜索了很长时间。但没有用。请帮助或尝试给出一些如何实现这一目标的想法。 特雷巴...
我什至在互联网上找到任何有同样问题的人都遇到了一些麻烦,因为它很难简洁地表达..:/ 本质上我的问题是我有一个 pytorch 张量,称之为 n: 张量([...
HuggingFace 模型 - OnnxRuntime - Jupyter Notebook 打印模型摘要
非常感谢您阅读我的问题,如果这是一个显而易见的问题,我很抱歉。 我使用 anaconda navigator :通过管道安装来自 OpenAi 的模型耳语,这是一个音频到文本转换器模型...
“在输入大量参数的情况下,如何让函数返回 Nonetype 属性”
整个项目可在 https://github.com/mwp-g/MWPG-DMR 获取 输出 代码 我在网上搜索了很长时间。但没有用。请帮助或尝试给出一些如何实现这一目标的想法。
“向前/向后通道尺寸”对于pytorch模型(Yolov3)来说太大了
我正在用 Pytorch 编写 Yolov3。 架构:https://i.sstatic.net/mncjfiDs.png 代码: 卷积类(nn.Module): # DBL def __init__(self, in_channels: int, out_channels: int, kernel_size: i...
当我运行此代码时,运行时会话会自动关闭。 RAM 中没有剩余空间。因此会话自动关闭。我在 Google Colab 笔记本中使用 pytorch。我尝试过切换...
Pytorch 多节点训练返回 TCPStore( RuntimeError: 地址已在使用中
我正在两台机器上训练一个网络,每台机器由两个 GPU 组成。我已经检查了端口号以将两台机器相互连接,但每次都会出现错误。 如何找到端口号...
我正在尝试使用 torchaudio 但无法导入它。我已经安装了它,并且通过 pip 列表也可以看到它。 在 ----> 1 进口
我试图计算两个张量之间的 L2 范数作为损失函数的一部分,但不知怎的,我的损失最终是 NaN,我怀疑它是因为 L2 范数的计算方式。可以吗
我正在尝试从 PyTorch 导入 Tensor: 从 torch 导入张量 但我不断收到此错误: ImportError:无法从“torch”(未知位置)导入名称“Tensor” 我尝试过的: 检查...
应用于数据增强的变换顺序在 Torchvision 变换中重要吗?
我有以下用于图像分割任务的自定义数据集类。 类LoadDataset(数据集): def __init__(self, img_dir, mask_dir, apply_transforms = None): self.img_dir = img_...
torch.as_tensor() 和 torch.asarray() 之间的区别
我从文档中了解到的是 torch.as_tensor() 和 torch.asarray() 都返回与输入数据共享内存的张量,否则返回一个副本。我只注意到两个
我的 LSTM 有三个输入(x,y,z)。我的 LSTM 模型用于预测 z 的下一个时间步长。我有 9 个时间步长的回顾期。然后我需要使用
我可以访问没有 GPU 的大型 CPU 集群。是否可以通过多个CPU节点之间的并行来加速YOLO训练? 文档说设备参数指定
通过 pytorch 中 Beta 分布的样本进行反向传播的问题
假设我从神经网络中获得了一些 alpha 和 beta 作为参数,这些参数将成为 Beta 分布的参数。现在,我从 Beta 分布中采样,然后计算一些损失...