深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。
我对垂死的 ReLU 问题感到困惑。 ReLU只会在前向传递过程中杀死神经元?或者也在向后传递过程中?
我对垂死的 ReLU 问题感到困惑。 ReLU 只会在前向传递过程中杀死神经元?或者也在向后传递期间?ufeff
我正在使用 pytorch 和 autograd 来构建我的神经网络架构。它是一个具有单一输入和输出的小型 3 层网络。假设我必须根据一些预测一些输出函数
如何使用 Google Collab 运行 python 包?
我想运行 DNA 存储库。我正在使用 Google Cloud Collab。我在 Google Drive 上克隆了该项目,位于以下目录 /content/drive/MyDrive/DAN/DAN 尝试运行示例脚本文件是
我在Python中使用keras tensorflow训练模型。 另外,正如您在下面的代码中看到的,我使用了种子参数,但是每次我使用相同的数据运行相同的代码时,我都会面临不同的准确率百分比...
你能告诉我随机梯度下降(SGD)和反向传播之间的区别吗?
我试图了解 Adam 优化器和梯度下降优化器之间有什么区别,以及哪一个最适合在哪种情况下使用。我正在查看 TF 网站,但我...
我试图了解 Adam 优化器和梯度下降优化器之间有什么区别,以及哪一个最适合在哪种情况下使用。我正在查看 TF 网站,但我...
我使用 ResNet18 主干网和研究建议的技术训练了 Cifar100 数据集,最终得到了一些令人惊讶的结果。我先尝试了两次
我使用 ResNet18 主干网和研究建议的技术训练了 Cifar100 数据集,最终得到了一些令人惊讶的结果。我先尝试了两次
我能够从批量梯度下降(批量大小37000)中获得相当好的结果,但是当我尝试小批量梯度下降时,我得到的结果非常差(即使使用adam和dropout)。 在批次 gd 中,我是
我正在学习有关 Google Cloud Platform (GCP) 深度学习的教程。根据教程它说: --train_steps 选项指定训练批次的总数。 然而...
当我阅读如何在 pybrain 中构建 ANN 时,他们说: 对网络进行一些时期的训练。通常你会设置一些东西 比如这里的5个, trainer.trainEpochs( 1 ) 我查了一下这是什么意思,
最近我了解了生成对抗网络。 对于训练生成器,我有点困惑它是如何学习的。以下是 GAN 的实现: `# 火车发电机 z =
有人能告诉我ReLU(修正线性单元)是如何工作的吗? 理论上,我明白了,但我需要一些演示。一个简单的 2x2 矩阵就可以了。希望你能在这方面帮助我。这与...
谁能告诉我上述算法是如何工作的。理论上我明白了,但我需要一些演示。一个简单的 2x2 矩阵就可以了。希望你能在这方面帮助我。这与...
无法在requires_grad=False的张量上保留grad,尽管专门将其设置为true
我正在尝试在pytorch中创建一个nn.module,set_model_params目前非常混乱,但我正在尝试将requires_grad设置为true,这样我就可以使用retain_grad(),但无论在哪里......
在深度学习和机器学习中,经常说学习率高、大、低或小,但我不知道这是什么意思。 *问题是关于如何用英语表达学习率....
我正在使用 PyTorch 构建图像分类模型。目前,各种军用飞机分为三类(F15、F16和F18,数据集从这里下载:https://www.kaggle....
如何从模型内部检查模型当前是否处于训练或评估模式?