deep-learning 相关问题

深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。

我在环境渲染中遇到错误 - env.render()

我试图在渲染时实现 Atari Games,但出现如下错误: 第 283 行,渲染中 引发错误。错误( gym.error.Error:render(mode=' human') 已弃用。请提供`

回答 2 投票 0

批量处理还是逐图像处理? (恐龙V1)

我一直在尝试为个人项目重新创建 Dino V1 训练设置。为此,我从该存储库中获取了大部分代码:https://github.com/facebookresearch/dino[dinov1 link]1 还有...

回答 1 投票 0

我对不同的输入得到相同的预测(PyTorch 神经网络回归问题)

我正在尝试使用 PyTorch 中的 ANN 来预测运动中燃烧的卡路里数 数据集可以在这里找到:https://www.kaggle.com/datasets/fmendes/fmendesdat263xdemos 我的问题是

回答 3 投票 0

训练期间错误:布局失败:INVALID_ARGUMENT:值 0 的大小与排列 4 的大小不匹配

我正在使用TensorFlow训练分割模型,在训练过程中遇到错误。大约 6 秒后,训练停止并显示以下错误消息: 埃...

回答 1 投票 0

在条件GAN(cGAN)架构中,为什么判别器需要条件变量?

我正在阅读有关条件 GAN (cGAN) 架构的内容,我所知道的是生成器创建结合噪声向量和条件变量的图像,噪声向量引入随机元素...

回答 1 投票 0

如何在 PyTorch 中实现这个注意力层?

我已经完成了 CNN 部分的实现,一切似乎都运行良好。之后开始实现 LSTM 部分,如果我没理解错的话,输出形状应该是 (

回答 1 投票 0

神经网络中损失函数的物理约束

我通过设计一个简单的问题来提出我的问题: 考虑到我想训练一个神经网络,我知道数据遵循 y=x^2 方程。 现在,我想向 NN 提供两个数据点(对于

回答 1 投票 0

如何在不增加内存的情况下减少神经网络的训练时间?

我想训练 rnn 模型(gru+lstm) 我的训练模型有 500000 个英文文本,我想用这些数据来训练和评估模型。当我检查一个时期的训练时间和批量大小时......

回答 1 投票 0

无框坐标 OpenCV::dnn 推理 GPU

我正在运行 YOLOv8 的推理(C++)示例,您可以在官方存储库中找到该示例。它在 CPU 上运行正常(慢),但正确绘制了方框,没有使用 GPU,它保持在 0%。 ...

回答 1 投票 0

哪种方法可以从原始图像中导出带标签的图块/补丁?

我的合作者有一组组织病理学幻灯片图像。然而他们没有贴标签的经验。通常对于 ML 训练,此类数据需要导出为带标签(在文件名中)的补丁/图块。是...

回答 1 投票 0

训练变压器将序列复制到相同的序列?

作为我学习过程的一部分,我想编写一个变压器模型来将输入序列复制到输出序列。我认为这会相对简单,但结果少于......

回答 1 投票 0

神经网络模型的训练输入得到错误的形状 ((预期形状=(None, 222, 222, 3), 发现形状=(None, None, 224, 224, 3) ))

所以我尝试使用 Oxford 102 花数据集训练神经网络模型。 但由于某种未知的原因,我在训练时使用 model.fit 出现错误,以下是与...相关的部分

回答 1 投票 0

分别对每个批处理元素调用 Keras Model.evaluate()

我想对一批 test_data 调用 tf.keras.Model.evaluate() (或类似的方法),并且我想分别取回每个批次元素的损失/指标。所以如果批次...

回答 1 投票 0

论文《Attention is all you need》中为什么当值很大时,softmax 得到的梯度很小

这是原始论文的屏幕:论文的屏幕。我理解论文的意思是,当点积的值很大时,softmax的梯度会变得很小。

回答 2 投票 0

如何计算使用 Tensorflow 在单个数据元素上训练 CNN 所需的内存

我正在尝试计算在特定数据集(或者一般情况下)上训练特定 CNN 所需的 GPU 内存量。原因是当我尝试训练这个网络时,我的记忆就用完了......

回答 1 投票 0

当两个不同的损失相差较大时,如何正确地将两个不同的损失相加?

我有两种不同的损失来训练模型。 L1 损失计算如下: recon_loss += F.l1_loss(pred_values, masked_patches) /total_num_masked 以及我的模型的另一个定制损失函数,

回答 1 投票 0

ValueError:层“lstm_cell_2”需要 3 个变量,但在加载过程中收到 0 个变量

我正在使用 Keras 使用以下代码在 Google Colab 上保存我的 Bi-Lstm 模型 以 open('BiLstm_model.pkl', 'wb') 作为作者: pickle.dump(lstm_model,作家) 现在,当我加载这个时...

回答 3 投票 0

在Poetry虚拟环境中安装Pytorch+cuda121时出错:来源(pytorch):访问https://download.pytorch.org/时授权错误

我希望在我的项目中使用yolov5模型和opencv。我目前正在使用 Poetry 作为我的项目的虚拟环境。 为了用gpu而不是cpu来操作yolov5,我正在寻找...

回答 1 投票 0

损失函数突然增加并停滞

我目前正在从事一个深度学习项目,涉及训练 U-net 来执行图像配准。网络的目标是将图像(我称之为“移动图像”)变形为

回答 1 投票 0

在 Django 项目中保持深度学习模型加载到内存中

我有一个深度学习模型,我已将其添加到我的 django web REST API 中。 我希望模型始终加载到内存中。目前,当用户请求时,模型会加载到内存中,然后在一段时间后释放

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.